앞서 법정동코드에서 지역코드를 가져오는 방법에 대해서 설명을 했다. 이번에는 우리가 정말 필요한 지역의 지역코드를 가져오는게 필요하다. 지역코드의 단위는 행정동으로 구분이 되어있기 때문에 서울특별시의 모든 지역코드를 가져오기 위해서는 별도의 처리가 필요하다. 서울특별시의 행정구는 총 25개로 나누어져있다.
위키를 보면 각각의 25개의 구에 대해서 인구, 세대, 면적을 표시하고 있다. 언제 수집을 했는지에 대해서는 나와있지 않다... 일단 25개의 행정구역으로 나누어져있기 때문에 우리는 위에 있는 지도로 봤을때 강서구, 양천구, 구로구,, ...., 강동구 등의 지역코드를 얻어야 한다.
df[df['지역코드'].apply(lambda x: x[:2] == '11')][['법정동명','지역코드']]
pd.DataFrame(df[df['지역코드'].apply(lambda x: x[:2] == '11')]['지역코드'].unique()).to_csv("../data/seoul_code.csv", index=False)
위 코드를 통해서 우리는 아래와 같은 결과를 얻을 수 있다.
지역코드 '11'이 지역코드에 있고, 지역코드의 셋(set)을 얻으면 총 26개를 얻을 수 있는데 이 중에는 서울특별시 11000이 포함되어있기 때문에 11000을 제거하면 우리가 원하는 서울특별시의 지역코드 25개를 얻을 수 있다. 이제 지역코드를 이용해서 공공데이터 포털에서 서울특별시 실거래매매 데이터를 가져오기가 가능하다.
서울 특별시 2019년 데이터를 가져오기 위해서는 12(1월~12월) x 25(행정구역) = 총 300번의 요청으로 가능하다. 공공데이터에서는 일일 트래픽이 1000이기 때문에 서울특별시 3년 데이터를 하루에 가져올 수 있다.
'[연재코너1] 파이썬으로 부동산 데이터 분석 해봐요 > Self 부동산 데이터 분석' 카테고리의 다른 글
[부동산 데이터] 부동산 실거래가 다운로드와 파일 읽는 방법 (인코딩) (0) | 2019.12.11 |
---|---|
[부동산데이터] 서울특별시 연도별 거래량이 감소하고 있다! (0) | 2019.12.09 |
서울에서 3년동안 가장 많은 아파트 실거래가 있었던 동은? 년도별 아파트 매매 건수 비교 (0) | 2019.12.07 |
[부동산 데이터 분석] 서울 마포구에서 4개월 동안 3억이 오른 아파트는 어디일까? (0) | 2019.12.03 |
[Python] 서울특별시 아파트 실거래 매매 데이터에서 법정동별 거래량 TOP20을 차트로 표현해보자 (0) | 2019.12.02 |