-
Pandas 결측값 제거 (엑셀 자동화, 빈칸의 행 / 열 삭제하기)프로그래밍 언어/Python 2021. 1. 14. 15:08
간단한 명부관리 엑셀 예제 위와 같은 표에서 E열이 비어있을 경우 행을 삭제하는 파이썬 프로그램을 작성해보겠다.
import pandas as pd # Pandas라이브러리를 import 한다. df = pd.read_excel( r"C:\Users\Myeongkook Park\Desktop\study\pandas\예제1.xlsx") # 엑셀파일을 df객체로 만든다. df = df[df['Phone'].notna()] # df 객체 중 Phone 컬럼이 비어있지 않는 행들로 새로운 df객체를 만든다. df.to_excel(r"C:\Users\Myeongkook Park\Desktop\study\pandas\예제1_result.xlsx",index=False) # df객체를 엑셀파일로 내보낸다.
df = df[df['Phone'].notna()] 의 Phone을 삭제하고 싶은 컬럼명 (열의 이름)으로 지정하면 된다.
위 예제와 같이 4줄의 작은 데이터에서는 굳이..? 이걸 사용할까싶지만 10,000개 이상의 데이터를 관리할 땐
판다스가 여러모로 빠르고 편리하다.
결측값이 삭제된 엑셀 예제 결과물 반대로 'Phone' 컬럼이 비어있는 행만 남기고 싶다면 df = df[df['Phone'].notna()] 의 notna() 대신 isna()를
입력하면 Phone이 비어있는 로우만 남기고 새로운 파일이 생성된다.
'프로그래밍 언어 > Python' 카테고리의 다른 글
[Pandas] 특정조건에 맞는 행으로 Dataframe 만들기 (0) 2021.05.03 Selenium ReadOnly Remove Attribute (0) 2021.03.18