의 ㄸdata lake / dataware house / data mart
data lake 는 비정형화된 로우 로그 수준의 모든 데이터를 저장.
datawarehouse 는 모델링되고 구조화된 데이터를 저장.
data mart 는 datawarehouse에서 특정 목적이 뚜렷한 성격의 데이터를 따로 가져가는 것으로 datawarehouse에 일부분이 될 수 있다.
data engineering 포지션에 4-6년차 경력직 면접이라면 나올 수 있는 기본적인 정의들이다.
뿐만 아니라 기본적인 용어 정리는 잘 정립해놓는 것이 커뮤니케이션에 좋다.
'우리는 개발자 > Data Engineering' 카테고리의 다른 글
[elasticsearch] nested type, nested type aggregation. (0) | 2020.01.11 |
---|---|
[elasticsearch] fielddata, doc_values에 대한 이해. (0) | 2020.01.11 |
[elasticsearch] cluster update setting. persistent, transient, default. (0) | 2019.12.20 |
[elasticsearch] java heap memory 설정 하기 + es node 재시작. (0) | 2019.12.18 |
[elasticsearch] kibana 설치, 연동하기 + filebeat설치하기. (2) | 2019.12.17 |