数据仓库

有赞数据仓库实践之路

构建大数据 Hadoop 生态下的数据仓库。细数有赞数据仓库的发展历程以及每个阶段各种选择的原因,欢迎更多有关数据仓库问题的交流。

数据仓库建模方法论Kimball与Inmon详解

最大的不同就是企业数据仓库的模式不同:inmon是采用第三范式的格式,kimball采用了多维模型–星型模型,并且还是最低粒度的数据存储。其次,维度数据仓库可以被分析系统直接访问(这种访问方式毕竟在分析过程中很少使用)。

数据仓库之Kafka

在流式计算中,Kafka一般用来缓存数据,Storm通过消费Kafka的数据进行计算

数据仓库中的拉链表

拉链表,记录每条信息的生命周期,一旦一条记录的生命周期结束,就要重新开始一条新的记录,并把当前日期放入生效的开始日期