데이터를 확인할때 가장먼저 NaN
을 확인하게 되는데, NaN
컬럼별로 얼마나 있는지 확인하기 위해서는 아래와 같이 하면된다.
이때 axis=0
은 column
을 의미하고, axis=1
은 index
를 의미한다. (앞으로도 많이 사용한다)
df.isnull().sum(axis = 0) # columns
NaN
을 확인할때는 np.isnan(), ~np.isnan()
을 이용하자NaN
의 데이터에 내가 원하는 값을 채워넣기 위해서는 아래와 같이 fillna(원하는값)
을 사용한다.
dataframe.fillna(0)
특정 컬럼에 대해서 null
을 확인하기 위해서는 아래와 같이 isnull()
을 추출하고 select하면 된다.
all_df[all_df['City'].isnull()]