Archive for December, 2012

听说要世界末日了

现在和家里人视频能让我感到心安。不过跟世界末日没有任何关系。2012来了又结束了。照例写点小结。

这一年把统计和优化的基础打完了,也重新把分析回顾了一下。统计推断本身似乎没什么魅力。说statistically significant 的时候,常常就意味着没别的significance 好说了。probability相比倒显得意义更大点,至少可以拿来作理论证明用。统计学习这一块,对我仍旧魅力非凡。路漫漫其修远兮。优化学了主干知识,知道了duality会推导kkt条件。为了学这东西还专门选了门课没花多少时间就拿了个10分,工科数学之水可见一斑。但我知道离得心应手地使用还差得很远,相比统计,优化需要更完备的数学积累。

2012比较意外的就是接触到信息论的东西。图灵百年演讲里听到ziv把信息论是和计算机科学相提并论时候被吓了一跳。后来知道MDL在数据挖掘领域现在大概算如日中天了。从entropy到Kolmogorov复杂度:一方面为DM/ML提供了理论基础,就是现在将各种模型都可以纳入的MDL框架;另一方面为计算机科学作了补充,即和计算复杂度共同成为描述程序的两个维度。找最小的MDL的模型常常是NP问题,如何在限制描述复杂度的情况下减小计算复杂度,或者反过来在限制计算复杂度的情况下减小描述复杂度,是非常好的研究问题。

慢慢对潮流有了抵抗力。deep learning, markov logic network,学术界的人就喜欢玩各种概念。再比如social network,这两年kdd上火得一塌糊涂,新问题层出不穷,要克制住真的不容易。从模式挖掘的这一块看就是把以往的item,itemset,推到sequential, 再推到tree和graph。知道来龙去脉了,也就不觉得神秘了。很多概念出现了,火过了,就死了。有些还活着,但是不能再搞了。记得4年前我刚接触分类聚类那会儿,听着多潮啊。有种再回首已是百年身的感觉。

这段时间对继续读博士的热情有了怀疑。路要走得好,光靠自己还是不行。机遇和环境缺一不可。不管怎样,先这样着。今年还是很好地完成了自己年初的设想。明年,把手头的经典读完再把coding能力好好磨一下。

Advertisements

Read Full Post »