취뽀 기록

#열심히 살자 #취업 #공부

Python/[개념 및 문법]

[python] 결측치 처리, 대체 map 함수

hyunnn_00 2024. 5. 3. 00:16

# 결측값 확인(비율)

# EDA - 결측값 확인(비율 확인)
df.isnull().sum() / df.shape[0]

 

 

# 결측치 컬럼 삭제하기

# 80%이상 결측치 컬럼, 삭제
df = df.drop('f3', axis = 1)

 

# city별 f1의 median 값 확인

# 80%미만 결측치 컬럼, city별 중앙값으로 대체
s = df[df['city'] == '서울']['f1'].median()
k = df[df['city'] == '경기']['f1'].median()
b = df[df['city'] == '부산']['f1'].median()
d = df[df['city'] == '대구']['f1'].median()

 

# map 함수 이용하여 f1의 결측값을 s, k, b, d로 대체하기

# f1 평균값 결과 출력
df['f1'] = df['f1'].fillna(df['city'].map({'서울' : s, '경기' : k, '부산' : b, '대구' : d}))