登录 | 首页 -> 华新鲜事 -> 社会百科 | 切换到:传统版 / sForum | 树形列表
谁知道哪里能找到数据仓库Datahouse实例的资料?
<<始页  [1]  末页>> 

谁知道哪里能找到数据仓库Datahouse实例的资料?[Lium (5-14 11:59, Long long ago)] [ 传统版 | sForum ][登录后回复]1楼

u mean data warehouse?try the kdd cup website, they have some benchmarks for the competition each yr.[南岳之麓 (5-14 12:20, Long long ago)] [ 传统版 | sForum ][登录后回复]2楼

(引用 南岳之麓:u mean data warehouse?try the kdd cup website, they have some benchmarks for the competition each yr.)谢谢,不过是要具体项目实施的例子[Lium (5-14 20:13, Long long ago)] [ 传统版 | sForum ][登录后回复]3楼

(引用 Lium:谢谢,不过是要具体项目实施的例子)你要知道做什么用途?对数据仓库的实施来说, 最重要的是ETL和OLAP Analysis.

数据仓库的数据要不停的Refresh, 做数据仓库的大部分投资都花在这上面。市面上较好的工具有Informatica, Cogno,都是超贵。数据通常都是先Direct Move 到Staging Area, 在Staging Area 进行一些Aggregation, Massage 然后再Direct Move 到Datawarehouse/Datamart里面。做ETL的步骤是:
1. Define Source Data
2. Design Target Data  
3. Design ETL Mapping
4. Implement
5. Testing
6. Maintance


数据仓库有了数据只是个White Elephant, 它的用途就在于OLAP Analysis,现在有很多公司花了几百万建造一个数据仓库, 可是Analysis却不够,导致project不太成功,花了那么多钱却没拿到什么Information。市场上原来有Business Object, Hyperion Essbase, Brio and Crystal Reports, 现在后两个已经被前两个收购掉了。

我就是做这个的,不过公司的东西不方便作为实列放出来。那些具体的项目实施过程,也挺复杂的。如果你是初学者的话,建议到http://www.billinmon.com/看看。数据仓库的概念最早是由Bill Inmon提出来的,网站上有些White Paper或许对你有帮助。可能可以找到一些你要的‘具体项目实施的列子‘。



[合组Apartment (5-16 18:36, Long long ago)] [ 传统版 | sForum ][登录后回复]4楼

(引用 合组Apartment:你要知道做什么用途?对数据仓库的实施来说, 最重要的是ETL和OLAP Analysis. 数据仓库的数据要不停的Refresh, 做数据仓库的大部分投资...)Anthony Tung同学的课也有讲Data warehouse 的可以看看他的Notes或者听课[合组Apartment (5-16 18:52, Long long ago)] [ 传统版 | sForum ][登录后回复]5楼

(引用 合组Apartment:Anthony Tung同学的课也有讲Data warehouse 的可以看看他的Notes或者听课)多谢,多谢[Lium (5-16 21:46, Long long ago)] [ 传统版 | sForum ][登录后回复]6楼


<<始页  [1]  末页>> 
登录 | 首页 -> 华新鲜事 -> 社会百科 | [刷新本页] | 切换到:传统版 / sForum