Programming/Python

Python pandas 2강 - DataFrame 사용

상맹 2021. 10. 26. 16:39
반응형

train.csv
0.06MB

import pandas as pd
import numpy as np

from google.colab import drive
drive.mount("/content/drive")

df = pd.read_csv("/content/drive/MyDrive/Colab Notebooks/train.csv")

- df.head() / df.tail()

# 헤드보기
print(df.head(n=3))
print("="*50)

# 꼬리보기
print(df.tail(n=2))

- df.sort_values(by="사용할 컬럼", ascending=False)

# 컬럼으로 정렬하기
df.sort_values(by="Survived", ascending=False)

- df.sort_index()

# 안중요
df.sort_index(ascending=False, axis=1)

- Selection

# 셀렉션 (칼럼 선택 , )
print(df[["Age","Survived"]].head())

# 셀렉션 (행 선택 : )
print(df[0:1])

- loc / iloc

print(df.loc[0])
print("="*50)
print(df.loc[0:4,["Age","Name"]])
print("="*50)

 

# loc 함수의 0:1은 1직전까지가 아니라 1까지다.
print(df.loc[0:0,["Age"]])

 

# iloc
print(df.iloc[3,1])

 

#loc
print(df.loc[3:3,["Survived"]])
print("="*50)
print(df.loc[2:4:2,["Survived"]])
print("="*50)
print(df.loc[[2,4],["Survived"]])
print("="*50)
print(df.iloc[[2,4],[0,2]]) # 컬럼명을 적을 수 없을 때(많지는 않다.) iloc를 사용한다.

반응형