第一章:BI理论知识
第二章:数据库基础知识
2.数据仓库
最后更新于 2020-12-27 22:56:12

什么是数据仓库?
数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策(Decision Making Support)。
面向主题的:经过ETL抽数、清洗、转换加载后,数据按不同主题存放在同一个库中,梳理归类;
集成的:不来来源的数据的集合。
相对稳定的:不会人为改变任何数据,只同步。如果源系统出故障了,数据仓库的数据依然存在。
反应历史变化:源系统数据库一般只保存几个月,定期删除,数据仓库可保存几年后压缩在硬盘里。

思考:
在源系统也能做报表,为什么要建立数仓?
因为每个源系统都有自己的功能,可以在这里进行分析或抽其他源系统的数据,但会影响这个系统的功能;其次,应用系统之间会重复抽取数据,为了避免源系统频繁交互,需要构建数仓。

精选评论
欢迎在这里发表留言,经过筛选后可公开显示
评论
取消