Python

Pandas, DataFrame 기록

체봄 2022. 1. 24. 15:46

 

import pandas ad pd

 

 

데이터를 DataFrame으로 읽어오기

  • csv 데이터인 경우
df = pd.read_csv('파일경로/파일명.csv', encoding='utf-8') # 한국어 데이터인 경우 encoding 명시
  • excel 데이터인 경우
df = pd.read_excel('파일경로/파일명.xlsx', engine='openpyxl')

 

 

DataFrame 생성하기

lis = [{'col1': 1, 'col2': 2}, {'col1': 3, 'col2': None}, {'col1': None, 'col2': 2}]
df = pd.DataFrame(lis)

###     col1	col2
### 0	1.0	2.0
### 1	3.0	NaN
### 2	NaN	2.0

 

 

특정 컬럼 값만 가져오기

df = df[['컬럼명1', '컬럼명2']]

 

 

특정 컬럼에 대해 조건을 만족하는 행 삭제

df = df.drop(df[df['컬럼명'] == 특정값].index)

 

  • 값이 NaN인 경우 삭제하려면
df = df.drop(df[df['컬럼명'] != df['컬럼명']].index)

 

 

 

반응형