IT
데이터 레이크 vs. 데이터 웨어하우스: 무엇이 다를까?
lo_me1230_IT
2025. 2. 27. 13:17
1. 데이터 레이크와 데이터 웨어하우스란?
데이터를 저장하고 분석하는 방식에는 **데이터 레이크(Data Lake)**와 **데이터 웨어하우스(Data Warehouse)**가 있습니다. 두 개념은 유사해 보이지만, 저장 방식과 활용 목적이 다릅니다.
2. 데이터 레이크란?
원시(raw) 데이터를 있는 그대로 저장하는 저장소
정형, 반정형, 비정형 데이터를 모두 수집 가능 (예: 로그 파일, 이미지, 동영상)
데이터 과학, 머신러닝과 같은 고급 분석에 적합
예시: AWS S3, Azure Data Lake
3. 데이터 웨어하우스란?
구조화된 데이터만 저장하는 중앙 저장소
데이터를 정제하고 변환한 후 분석 가능 (예: 매출 보고서, 고객 분석)
BI(Business Intelligence) 및 빠른 쿼리 성능을 요구하는 분석에 적합
예시: Amazon Redshift, Google BigQuery
4. 주요 차이점
5. 결론
데이터 레이크는 대량의 비정형 데이터를 저장하고 AI 분석에 적합하며, 데이터 웨어하우스는 정제된 데이터를 기반으로 빠른 비즈니스 분석에 적합합니다. 기업의 데이터 활용 목적에 따라 적절한 시스템을 선택하는 것이 중요합니다.