# 결측값 확인(비율)
# EDA - 결측값 확인(비율 확인)
df.isnull().sum() / df.shape[0]
# 결측치 컬럼 삭제하기
# 80%이상 결측치 컬럼, 삭제
df = df.drop('f3', axis = 1)
# city별 f1의 median 값 확인
# 80%미만 결측치 컬럼, city별 중앙값으로 대체
s = df[df['city'] == '서울']['f1'].median()
k = df[df['city'] == '경기']['f1'].median()
b = df[df['city'] == '부산']['f1'].median()
d = df[df['city'] == '대구']['f1'].median()
# map 함수 이용하여 f1의 결측값을 s, k, b, d로 대체하기
# f1 평균값 결과 출력
df['f1'] = df['f1'].fillna(df['city'].map({'서울' : s, '경기' : k, '부산' : b, '대구' : d}))
'Python > [개념 및 문법]' 카테고리의 다른 글
[python] loc 활용 사례 (0) | 2024.05.03 |
---|---|
[python] 2차원 리스트 사용하기 (0) | 2023.07.17 |
[python] 2차원 배열과 for문 (0) | 2023.07.14 |
[python] 2차원 배열 입력받기 (0) | 2023.07.14 |
[python] 2차원 배열 선언과 활용 (0) | 2023.07.14 |