|
|
|
|
复制本帖HTML代码
|
高亮:
今天贴
X 昨天贴
X 前天贴
X |
正好以前辈的回帖为契机,来表达一下还没表达清楚的观点。顺便小结一下这个帖子。
1) 工业界和学术界在大潮之中的定位
大数据时代,数据成了最重要的资源。学术界没有像工业界那样拥有第一手的数据,表面上看起来,的确处于劣势。但不要忘记,统计这门科学,本来就是在数据稀缺的时代被发明的。统计的本质就是从有限甚至少量的数据中推断出普遍的规律。只要人或者机器不能达到全知全能,统计这门科学就有意义。
而且,machine learning 能够 work 的两个基本前提是数据有代表性和Chebyshev's Inequality。(当然,大部分数据从业者可能认为自己搞出来的东西能 work 的原因是自己吊。)现实中,数据量不满足Chebyshev's Inequality的情况比比皆是。比如说金融数据,数据量不足和heteroskedasticity 给 machine learning 在金融中的应用带来了巨大的挑战。在这种情况下,开发新的,数据需要量小的/收敛速度快的模型就变得非常有必要。而这种活,一般都是学术界干的比较好。
2)数据科学的前景
大部分人都不会否认,数据科学前景巨大。但到底是什么样的前景,有多巨大,每个人可能都有自己的理解。不管怎么理解,祝大家在新的浪潮中弄潮愉快。
.
|
欢迎来到华新中文网,踊跃发帖是支持我们的最好方法! |
|
|