배우기/Python5 Python_Pandas_DataFrame(데이터 개수 확인)_4 안녕하세요! 위도와 경도 데이터를 병합한 데이터프레임을 최종적으로 확인하고 저장합니다. print("총 데이터 개수: ", da2.shape[0]*da2.shape[1]) print("총 결측치 수: {} = 전체 데이터의 {:.2f}% ".format(da2.isnull().sum().sum(), (da2.isnull().sum().sum()*100)/(da2.shape[0]*da2.shape[1]))) print("자치구 수: ", da2['시군구'].nunique()) print("거래 건 수: ", da2['거래번호'].nunique()) print('19년 데이터:', apt19.notnull().sum().sum()) print('19년 결측치:', apt19.isnull().sum().sum.. 2022. 4. 20. Python_Pandas_DataFrame(인덱스 초기화, 병합)_3 안녕하세요! 인덱스 초기화와 병합으로 글을 이어가 보겠습니다. a라는 변수에 데이터프레임을 복사해서 저장하고 reset_index 함수를 사용하여 기존 인덱스를 드랍하고 덮어씌웁니다. 표준데이터셋 점검 사이트에서 변환한 위도와 경도 파일을 병합합니다. (Pandas.concat 참고 Documentation) 전체 파일을 분할하여 작성했기 때문에 병합 과정에서 인덱스를 초기화(ignore_index = True)했습니다. 각 변수는 row를 기준(axis = 0)으로 병합합니다. (아래로 쌓아나가야 하기 때문!) 위도와 경도 컬럼만 뽑아냅니다. 데이터프레임 a와 위도/경도 데이터프레임 da1을 column (axis = 1) 기준으로 병합합니다. 다음 글은 병합한 데이터프레임의 결측치를 제거하고 xlsx.. 2022. 4. 20. Python_Pandas_DataFrame(컬럼 합치기, 파일 저장) 안녕하세요! 위경도 변환을 위한 엑셀 파일을 파이썬으로 만들어보았습니다. data = pd.DataFrame() # 빈 데이터프레임 만들기 cols = tmp1['시도'] + " " + tmp1['시군구'] + " " + tmp1['도로명'] # 컬럼과 컬럼 사이의 공백을 합친다. data.insert(0, '도로명주소', cols) # 데이터프레임의 0번 자리에 '도로명주소'라는 새로운 컬럼명으로 합친 컬럼을 삽입한다. cols1 = tmp1['시도'] + ' ' + tmp1['시군구'] + ' ' + tmp1['읍면동'] + ' ' + tmp1['번지'] data.insert(1, '지번주소', cols1) # 위와 동일한 방법 data['위도'] = [] data['경도'] = np.nan # 빈 .. 2022. 4. 19. Python_Pandas_DataFrame(결측치 제거)_2 안녕하세요! 판다스 라이브러리의 데이터프레임 결측치 제거입니다. 자세한 내용은 Documentation 에서 확인할 수 있습니다. DataFrame.dropna(axis=0|1, how='any'|'all', thresh=int, subset=['컬럼명'], inplace=bool) axis = 0 or 'index' | 1 or 'columns, default 0 how = 'any' | 'all', default 'any' thresh = int, optional (결측치의 특정 개수 입력) subset = ['컬럼명'], optional (2개 이상 컬럼 가능) inplace = bool, default False - DataFrame 사용 예시 df.dropna(axis = 0 | 1) # axi.. 2022. 4. 19. Python_Pandas_DataFrame(파일 불러오기, 데이터프레임 정보 확인)_1 안녕하세요! 파이썬에서 csv, excel 등의 파일을 불러오는 방법과 데이터프레임의 간단한 정보를 확인하는 방법입니다. import pandas as pd # 판다스 라이브러리, alias(약칭) pd 사용 df = pd.read_csv('./파일명.csv') # csv 파일 불러오기 df = pd.read_excel('./파일명.xlsx') # excel 파일 불러오기 (xlsx, xls 가능) df.info() # 데이터프레임의 인덱스, 컬럼, 데이터, 데이터타입, 메모리 사용 등에 대한 정보 확인 df.head(N) # 데이터프레임 상위 N개 데이터 확인 df.tail(N) # 데이터프레임 하위 N개 데이터 확인 df.isnull() # 데이터프레임 결측치 확인 df.isnull().sum() #.. 2022. 4. 14. 이전 1 다음