https://doubly12f.tistory.com/72

 

부동산 법정동코드 다운로드 및 인코딩 문제 해결 방법

부동산 아파트 매매 실거래 상세 자료를 갖고 오기 위해서는 지역코드와 기간을 이용하여 해당 기간에 해당지역의 아파트 매매 신고자료를 조회할 수 있다. 아래 URL을 보면 아파트매매 실거래 가져오기 위한 요청..

doubly12f.tistory.com

위 글에서 법정동코드를 다운로드 받고 인코딩 문제까지 알아보았다. 법정동코드와 행정동코드를 구분을 해야 공공데이터포털에서 원하는 지역의 데이터를 가져올 수 있다.

법정동코드에는 행정동코드가 포함되어 있다. ABC가 법정동코드라면 A는 행정동코드이다. 예를들어서 ABC가 서울특별시 종로구라고 한다면 A는 서울특별시의 행정동 코드이다. 그럼 법정동 코드에서 어떻게 행정동코드를 추출하는지 알아보자. 

pandas를 이용해서 위에서 얻은 파일을 읽으면, 법정동코드가 int64로 읽힌다. 법정동코드는 숫자의 의미가 아니기 때문에 문자열로 변환을 해준다. 변환이후에 [:5]의 slicing을 이용해서 최종 지역코드를 얻어낼 수 있다.

import pandas as pd
df.read_csv('../data/road_code.csv', index=False) 

df['폐지여부'].value_counts()

폐지    25565
존재    20542
Name: 폐지여부, dtype: int64

df = df[df['폐지여부'] == '존재']

df.dtypes
법정동코드     int64
법정동명     object
폐지여부     object
dtype: object

df['법정동코드'] = df['법정동코드'].astype(str)
df['지역코드'] = df['법정동코드'].apply(lambda x: x[:5])
df.head(5)

법정동코드	법정동명	폐지여부	지역코드
0	1100000000	서울특별시	존재	11000
1	1111000000	서울특별시 종로구	존재	11110
2	1111010100	서울특별시 종로구 청운동	존재	11110
3	1111010200	서울특별시 종로구 신교동	존재	11110
4	1111010300	서울특별시 종로구 궁정동	존재	11110

 

+ Recent posts