반응형
import pandas as pd
import numpy as np
from google.colab import drive
drive.mount("/content/drive")
df = pd.read_csv("/content/drive/MyDrive/Colab Notebooks/train.csv")
- df.head() / df.tail()
# 헤드보기
print(df.head(n=3))
print("="*50)
# 꼬리보기
print(df.tail(n=2))
- df.sort_values(by="사용할 컬럼", ascending=False)
# 컬럼으로 정렬하기
df.sort_values(by="Survived", ascending=False)
- df.sort_index()
# 안중요
df.sort_index(ascending=False, axis=1)
- Selection
# 셀렉션 (칼럼 선택 , )
print(df[["Age","Survived"]].head())
# 셀렉션 (행 선택 : )
print(df[0:1])
- loc / iloc
print(df.loc[0])
print("="*50)
print(df.loc[0:4,["Age","Name"]])
print("="*50)
# loc 함수의 0:1은 1직전까지가 아니라 1까지다.
print(df.loc[0:0,["Age"]])
# iloc
print(df.iloc[3,1])
#loc
print(df.loc[3:3,["Survived"]])
print("="*50)
print(df.loc[2:4:2,["Survived"]])
print("="*50)
print(df.loc[[2,4],["Survived"]])
print("="*50)
print(df.iloc[[2,4],[0,2]]) # 컬럼명을 적을 수 없을 때(많지는 않다.) iloc를 사용한다.
반응형
'Programming > Python' 카테고리의 다른 글
Python pandas 3강 - Nan 제거 (0) | 2021.10.26 |
---|---|
Python pandas 1강 - 데이터 다루기 (0) | 2021.10.26 |
Python Numpy 7강 - 행렬곱, 연립방정식 (2) | 2021.10.21 |
Python Numpy 6강 - BroadCasting (0) | 2021.10.20 |
Python Numpy 5강 - DB연결, 학습 (0) | 2021.10.20 |