Python
Pandas, DataFrame 기록
체봄
2022. 1. 24. 15:46
import pandas ad pd
데이터를 DataFrame으로 읽어오기
- csv 데이터인 경우
df = pd.read_csv('파일경로/파일명.csv', encoding='utf-8') # 한국어 데이터인 경우 encoding 명시
- excel 데이터인 경우
df = pd.read_excel('파일경로/파일명.xlsx', engine='openpyxl')
DataFrame 생성하기
lis = [{'col1': 1, 'col2': 2}, {'col1': 3, 'col2': None}, {'col1': None, 'col2': 2}]
df = pd.DataFrame(lis)
### col1 col2
### 0 1.0 2.0
### 1 3.0 NaN
### 2 NaN 2.0
특정 컬럼 값만 가져오기
df = df[['컬럼명1', '컬럼명2']]
특정 컬럼에 대해 조건을 만족하는 행 삭제
df = df.drop(df[df['컬럼명'] == 특정값].index)
- 값이 NaN인 경우 삭제하려면
df = df.drop(df[df['컬럼명'] != df['컬럼명']].index)
반응형