부동산 아파트 매매 실거래 상세 자료를 갖고 오기 위해서는 지역코드와 기간을 이용하여 해당 기간에 해당지역의 아파트 매매 신고자료를 조회할 수 있다. 아래 URL을 보면 아파트매매 실거래 가져오기 위한 요청변수와, 출력결과에 대해서 문서화 되어 있다.

https://www.data.go.kr/subMain.jsp#/L3B1YnIvcG90L215cC9Jcm9zTXlQYWdlL29wZW5EZXZHdWlkZVBhZ2UkQF4wMTIkQF5wdWJsaWNEYXRhRGV0YWlsUGs9dWRkaTo1NDA0Nzg1ZS1lZDRjLTRiNzItODhmZS04YjI1Y2UwMGJiNmYkQF5tYWluRmxhZz10cnVl

여기서 지역코드를 가져와야하는데 지역코드에 대한 정보가 바로 없다.

행정표준코드관리시스템을 들어가면... 접속이 안된다.

공공데이터활용지원 센터에서 가이드를 보니 행정표준코드관리시스템에서 다운로드 하라고..

맥을 사용한다면 행정표준코드관리시스템 (https://www.code.go.kr/) 은 맥에서 접속이 안되고, 사파리에서 접속이 가능하다!

행정표준코드관리시스템에서 코드검색에 코드명 법정동을 입력하면 코드명 법정동이 나온다.

법정동 코드 전체자료를 다운로드하면 모든 법정동 코드 다운로드가 가능하다. 다운로드하고 파일을 열어보면 아래와 같이 깨져있는데,

인코딩 문제이다. 아마도 이 코드를 제공하는 제공자가 Window를 써서 이런 문제가 생긴게 아닌가 싶다. 우리는 utf8의 인코딩의 변환이 필요하기 때문에 다음과 같이 변환을 시도하면 원하는 결과를 얻을 수 있다.

df = pd.read_csv('/Users/direcision/Downloads/π˝¡§µøƒ⁄µÂ ¿¸√º¿⁄∑·.txt', encoding='cp949', sep='\t' )
df.to_csv('../data/rcode.csv', index=False) 

법정동 코드에 대한 전처리는 이후 포스팅에서 다루도록 한다.

+ Recent posts