https://doubly12f.tistory.com/72
위 글에서 법정동코드를 다운로드 받고 인코딩 문제까지 알아보았다. 법정동코드와 행정동코드를 구분을 해야 공공데이터포털에서 원하는 지역의 데이터를 가져올 수 있다.
법정동코드에는 행정동코드가 포함되어 있다. ABC가 법정동코드라면 A는 행정동코드이다. 예를들어서 ABC가 서울특별시 종로구라고 한다면 A는 서울특별시의 행정동 코드이다. 그럼 법정동 코드에서 어떻게 행정동코드를 추출하는지 알아보자.
pandas를 이용해서 위에서 얻은 파일을 읽으면, 법정동코드가 int64로 읽힌다. 법정동코드는 숫자의 의미가 아니기 때문에 문자열로 변환을 해준다. 변환이후에 [:5]의 slicing을 이용해서 최종 지역코드를 얻어낼 수 있다.
import pandas as pd
df.read_csv('../data/road_code.csv', index=False)
df['폐지여부'].value_counts()
폐지 25565
존재 20542
Name: 폐지여부, dtype: int64
df = df[df['폐지여부'] == '존재']
df.dtypes
법정동코드 int64
법정동명 object
폐지여부 object
dtype: object
df['법정동코드'] = df['법정동코드'].astype(str)
df['지역코드'] = df['법정동코드'].apply(lambda x: x[:5])
df.head(5)
법정동코드 법정동명 폐지여부 지역코드
0 1100000000 서울특별시 존재 11000
1 1111000000 서울특별시 종로구 존재 11110
2 1111010100 서울특별시 종로구 청운동 존재 11110
3 1111010200 서울특별시 종로구 신교동 존재 11110
4 1111010300 서울특별시 종로구 궁정동 존재 11110
'[연재코너1] 파이썬으로 부동산 데이터 분석 해봐요' 카테고리의 다른 글
[Solved] 공공데이터포털 python3 SERVICE KEY IS NOT REGISTERED ERROR (0) | 2019.11.28 |
---|