ML 실습 (1) 썸네일형 리스트형 Kaggle 1강 - EDA 1. data 전체 확인 1) 중복 data 1> df.duplicated(): 중복 여부를 True, False로 알려준다. 2> df[df.duplicated()]: 위를 boolean indexing을 통해 중복 data(row)를 따로 출력 3> df.drop_duplicates(): 중복 data가 제거된 DataFrame 2) 누락 data 1> df.info(): DataFrame에 대한 요약 정보(null, type)가 담겨 있으며 한 번에 null-data 파악 가능 2> df.isna: 누락 data에서 True를 반환 (== isnull() )) - df.notna: 누락 data에서 False를 반환 (== notnull() )) - df.isnull().sum(): 으로도 누락 d.. 이전 1 다음