부동산 실거래가를 공공데이터에서 제공하는 API로 다운로드를 받았는데 그럴 필요가 없다는 사실을 알아서 충격이였다.
국토교통부에서 실거래가 공개시스템이 있는데 기간을 설정하면 특정날짜에 실거래가 데이터를 다운로드 받을 수 있다. 실제로 다운로드 받은 데이터와 API를 통해 다운로드 받은 데이터의 개수가 다른것을 확인하니 어디 쪽을 믿어야 하나... 일단 데이터를 다운로드 받고 나서 아래와 같이 파일을 읽으면 된다. 맥에서는 encoding을 `cp949`로 해줘야 한다는것! 처음 header를 찾는 곳을 똑똑하게 할 수 있겠지만 그닥 중요하지 않으니... 아래 코드를
f = open("/Users/Direcision/Desktop/아파트(매매)__실거래가_20191211233713.csv","r", encoding='cp949')
lines = f.readlines()
cols = lines[15][:-1]
cols = cols.split("\"")
cols = list(filter(lambda x: (x != '') & (x != ',') ,cols))
data = lines[16:]
rows = []
for d in data:
d = d[:-1].split("\"")
d = list(filter(lambda x: (x != '') & (x != ',') ,d))
rows.append(d)
df = pd.DataFrame(rows, columns=cols)
'[연재코너1] 파이썬으로 부동산 데이터 분석 해봐요 > Self 부동산 데이터 분석' 카테고리의 다른 글
[부동산] 공공데이터 층에 NaN? 0층? (0) | 2020.02.25 |
---|---|
[부동산] 아파트 매매/전월세 데이터 효율적으로 가져오기 (0) | 2020.02.25 |
[부동산데이터] 서울특별시 연도별 거래량이 감소하고 있다! (0) | 2019.12.09 |
서울에서 3년동안 가장 많은 아파트 실거래가 있었던 동은? 년도별 아파트 매매 건수 비교 (0) | 2019.12.07 |
[부동산 데이터 분석] 서울 마포구에서 4개월 동안 3억이 오른 아파트는 어디일까? (0) | 2019.12.03 |