안녕하세요!
파이썬에서 csv, excel 등의 파일을 불러오는 방법과
데이터프레임의 간단한 정보를 확인하는 방법입니다.
import pandas as pd # 판다스 라이브러리, alias(약칭) pd 사용
df = pd.read_csv('./파일명.csv') # csv 파일 불러오기
df = pd.read_excel('./파일명.xlsx') # excel 파일 불러오기 (xlsx, xls 가능)
df.info()
# 데이터프레임의 인덱스, 컬럼, 데이터, 데이터타입, 메모리 사용 등에 대한 정보 확인
df.head(N) # 데이터프레임 상위 N개 데이터 확인
df.tail(N) # 데이터프레임 하위 N개 데이터 확인
df.isnull()
# 데이터프레임 결측치 확인
df.isnull().sum() # 컬럼 별 결측치 합계
df.isnull().sum().sum() # 데이터프레임 결측치 총 합계
df.notnull()
# 데이터프레임 결측치 아닌 것 합계 (isnull과 동일하게 sum()으로 개수 확인)
df.describe() # 연속형(수치)의 통계치 확인
df.describe(include = object) # 범주형 데이터의 통계치 확인
데이터 출처 : http://rtdown.molit.go.kr/
'배우기 > Python' 카테고리의 다른 글
Python_Pandas_DataFrame(데이터 개수 확인)_4 (0) | 2022.04.20 |
---|---|
Python_Pandas_DataFrame(인덱스 초기화, 병합)_3 (0) | 2022.04.20 |
Python_Pandas_DataFrame(컬럼 합치기, 파일 저장) (0) | 2022.04.19 |
Python_Pandas_DataFrame(결측치 제거)_2 (0) | 2022.04.19 |
댓글