티스토리 뷰
import pandas ad pd
데이터를 DataFrame으로 읽어오기
- csv 데이터인 경우
df = pd.read_csv('파일경로/파일명.csv', encoding='utf-8') # 한국어 데이터인 경우 encoding 명시
- excel 데이터인 경우
df = pd.read_excel('파일경로/파일명.xlsx', engine='openpyxl')
DataFrame 생성하기
lis = [{'col1': 1, 'col2': 2}, {'col1': 3, 'col2': None}, {'col1': None, 'col2': 2}]
df = pd.DataFrame(lis)
### col1 col2
### 0 1.0 2.0
### 1 3.0 NaN
### 2 NaN 2.0
특정 컬럼 값만 가져오기
df = df[['컬럼명1', '컬럼명2']]
특정 컬럼에 대해 조건을 만족하는 행 삭제
df = df.drop(df[df['컬럼명'] == 특정값].index)
- 값이 NaN인 경우 삭제하려면
df = df.drop(df[df['컬럼명'] != df['컬럼명']].index)
반응형
'Python' 카테고리의 다른 글
tqdm을 enumerate/zip과 함께 사용하기 (0) | 2022.05.05 |
---|---|
**kwargs (0) | 2022.02.23 |
jsonl 파일 읽기/쓰기 (0) | 2021.10.25 |
[Python] 리스트 안의 딕셔너리 중복 제거하기 (0) | 2021.10.01 |
Numpy axis 이해하기 (0) | 2021.09.05 |
댓글