数据仓库(Data Warehouse)是用于存储、管理和分析结构化数据的系统,主要服务于企业决策支持。以下是关键知识点:

1. 核心概念 📚

  • 数据集成:通过ETL(抽取、转换、加载)流程聚合多源数据
  • 主题导向:按业务主题划分数据,如销售、客户、产品
  • 历史性:保存随时间变化的数据,支持趋势分析
  • 非易失性:数据一旦写入即保持不变,便于审计

2. 架构组成 🧠

  • 数据源:关系型数据库、日志文件、API等
  • 数据存储:星型/雪花型模型,事实表与维度表
  • 数据访问层:OLAP工具(如Tableau)或BI平台
  • 元数据管理:描述数据结构、来源与业务含义

3. 应用场景 🚀

  • 业务报表:生成销售业绩、库存周转等统计结果
  • 数据分析:支持用户行为、市场趋势的深度挖掘
  • 数据挖掘:通过机器学习发现隐藏模式
  • 数据治理:统一数据标准与质量管控

4. 学习资源 🖥️

数据仓库_架构
ETL_流程