본문 바로가기
배우기/Python

Python_Pandas_DataFrame(파일 불러오기, 데이터프레임 정보 확인)_1

by 인사잘해 2022. 4. 14.

안녕하세요!

 

파이썬에서 csv, excel 등의 파일을 불러오는 방법과

데이터프레임의 간단한 정보를 확인하는 방법입니다.

import pandas as pd   # 판다스 라이브러리, alias(약칭) pd 사용
df = pd.read_csv('./파일명.csv') # csv 파일 불러오기
df = pd.read_excel('./파일명.xlsx') # excel 파일 불러오기 (xlsx, xls 가능)

 

서울시 아파트 실거래 데이터 사용했습니다.

df.info() 
# 데이터프레임의 인덱스, 컬럼, 데이터, 데이터타입, 메모리 사용 등에 대한 정보 확인

df.head(N) # 데이터프레임 상위 N개 데이터 확인
df.tail(N) # 데이터프레임 하위 N개 데이터 확인

df.isnull() 
# 데이터프레임 결측치 확인
df.isnull().sum() # 컬럼 별 결측치 합계
df.isnull().sum().sum() # 데이터프레임 결측치 총 합계
df.notnull() 
# 데이터프레임 결측치 아닌 것 합계 (isnull과 동일하게 sum()으로 개수 확인)

df.describe() # 연속형(수치)의 통계치 확인
df.describe(include = object) # 범주형 데이터의 통계치 확인

 

 

 

데이터 출처 : http://rtdown.molit.go.kr/

댓글