ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • Pandas 결측값 제거 (엑셀 자동화, 빈칸의 행 / 열 삭제하기)
    프로그래밍 언어/Python 2021. 1. 14. 15:08

    간단한 명부관리 엑셀 예제

    위와 같은 표에서 E열이 비어있을 경우 행을 삭제하는 파이썬 프로그램을 작성해보겠다.

     

    import pandas as pd # Pandas라이브러리를 import 한다.
    
    df = pd.read_excel(
        r"C:\Users\Myeongkook Park\Desktop\study\pandas\예제1.xlsx")  # 엑셀파일을 df객체로 만든다.
    df = df[df['Phone'].notna()]  # df 객체 중 Phone 컬럼이 비어있지 않는 행들로 새로운 df객체를 만든다.
    df.to_excel(r"C:\Users\Myeongkook Park\Desktop\study\pandas\예제1_result.xlsx",index=False)  # df객체를 엑셀파일로 내보낸다.
    

     

    df = df[df['Phone'].notna()] 의 Phone을 삭제하고 싶은 컬럼명 (열의 이름)으로 지정하면 된다.

    위 예제와 같이 4줄의 작은 데이터에서는 굳이..? 이걸 사용할까싶지만 10,000개 이상의 데이터를 관리할 땐

    판다스가 여러모로 빠르고 편리하다.

     

    결측값이 삭제된 엑셀 예제 결과물

    반대로 'Phone' 컬럼이 비어있는 행만 남기고 싶다면 df = df[df['Phone'].notna()] 의 notna() 대신 isna()

    입력하면 Phone이 비어있는 로우만 남기고 새로운 파일이 생성된다.

    댓글

Designed by Tistory.