個人檔案王益的空间 Wang Yi's MSN Spac...相片部落格清單更多 工具 說明
15 October

How Come Innovation and Novelty

Years ago, when I was an intern at Microsoft Research Asia, my boss, Dr. Harry Sheumg, once said: “You want novelty? Try changing your perspective.  If it is difficult to solve a problem in the time domain, try to convert it into the frequency domain.”  An EE specialist may fulfill Harry’s suggestion by the example of Fourier transform, which transforms a single into a mixture of sine waves with various frequencies.  The weights of the frequencies represent this single in the frequency domain.

Years later after then, my work are related with Latent Dirichlet allocation (LDA), a revolutionary Bayesian solution to latent semantic analysis.  Sometimes, I feel lucky to work around LDA, as you know, LDA is considered such an innovation. It brings new possibility to information retrieval, collaborative filtering, text clustering and recommendations systems. Dozens, if not hundreds, of papers follow it since it was proposed in 2003. 

Today, right after my dinner, when I passed by the desk of an intern, with my brain filled by theories related with LDA, I found an introduction to Fourier transform. Flashes bursted in my mind --- how similar LDA to Fourier transform!  The input of LDA is documents represented by words and their counts, the frequency information.  And for each document, LDA decomposes its word frequencies into a mixture of multinomial distributions, where each multinomial distribution represents the word frequencies of a latent topic.  Then each document is represented by weights on these multinomial distributions --- a representation in the frequency domain. This representation is much more concise than the bag of words of the document, the representation of documents in the time domain, where time elapses with the writing of the document.  It is this conciseness that makes many applications much faster than doing them in the time domain.

9 October

鱼刺扎嗓子

今天非常幸运的中奖了——在公司吃晚饭的时候一根鱼刺扎在嗓子里。扎的地方比较偏僻,不是吞口米饭可以带下去的。只好去医院。身上没钱,文彦和程翔马上递过来;Jon起身陪我直奔海淀医院。一路上一咽唾沫就扎得疼,一扭头一说话都疼。好容易到了,发现大门紧锁——这医院不是出了医疗事故关门了吧?好容易在楼梯下面找到一个小门,进去是急诊。排队挂号。好容易排到了,小护士说:我们这没有口腔科。那怎么办?去北医三院吧。 —— 他妈的,幸亏兄弟接受了国家多年的教育,要不然双截棍白练了这么久!

像Jon这样永远保持者一贯的洒脱温和的文化气息的美国知识分子都跟着我恨恨的骂了一句:“他妈的。”

然后我俩就洒脱温和的文化气息的打了另一辆的士前往北医三院。在经历了痛苦的大半个小时的排队之后,进入急诊室,映入眼帘的是一个娇美如花的小女医生!!娇小的身材在白大褂和毛衣之下都透出可爱的曲线。凝雪般的皮肤,两弯娟秀的眉毛,自信又专注的眼神,在拥挤嘈杂的急诊大楼里如一汪清泉般沉静中透着健康的气息。

小美女修长的手指拿着一块纱布,说:“伸舌头。“我很不好意思的,张张嘴,但很不好意思伸出舌头来。“没关系的,再伸长点。”细腻温柔的声音。“豁出去了“我心想“益哥舌头又大又长是有名的。“——”喔~~~“ 小美女闪电般的抓住我的舌尖把益哥有名的大舌头拽出来,另一只手将一个三四十公分长90度弯曲的镊子深入我的喉咙,在我还没回过神来之前,把一跟将近3厘米长的鱼刺取了出来。低头一看:鱼刺一端5mm长有血迹——扎肉里了。

回到公司,同事们都围上来关心我——关心我的刺。大家表达了两种主流意见:(1)王益真厉害,能把这么大的刺吞喉咙里;(2)把刺拿来扎我喉咙里,我也要去看美女小医生!
7 October

相濡以沫

相濡以沫这个成语是我印象里特别有意思的一个。小时候老师告诉我们,“濡”就是打湿或者浸湿的意思,“沫”指的是口水。“相濡以沫”字面意思就是互相用口水打湿对方。乍一听相当的不卫生——什么情况下会用口水打湿对方呢?!

记得上小学地时候妈妈给我买了本《小学生图解成语词典》,里面在“相濡以沫”旁边地图示是两个人,在席子上相对跪坐着,谈兴正浓,窗外月上三干,估计是表示这两人聊一整夜,互喷口水,把对方地衣服打湿了。看着这幅图,我就想起一个场景:老师在讲坛上呜哩哇啦,第一排的小学生缩着脑袋拿起一本课本“遮雨”。当然,这个不是“互相”用口水打湿。

时隔多年,我也将近而立之年。一夜孤枕而卧,春宵一梦,朦胧醒来,突然顿悟——图解成语词典是骗人的!!!


3 October

骑马

骑了这么多次马,这次竟然磨破了屁股和裤子!结论是,上马时候如果发现马鞍和马镫有问题,一定要坚决的调整或更换,不能为马场老板省功夫。最近心情不好,心浮气躁,出发前检查发现的问题懒得处理,奔的时候心烦意乱带马走错了路。必须检讨。

我喜欢骑快马,性子急的马一般体力都不错,但是通常比较瓜,更需要人用技术和经验辅助。人骑在马背上,高,所以视野比马广,而且人是双眼向前看,和马相比,视野虽小,但是距离感更好。所以,如果看到前方有大坑后者陡坡,一定要拉缰绳,提醒马儿减速,或者绕道。今天益哥大意了,因为心浮气躁要图快,马沿着斜坡跑的时候,没有让马减速,结果马儿右边后蹄一下没有蹬稳地面,险些摔倒。又因为马镫绳子短,益哥重心高,腿夹不稳,结果摔下来,沿着小坡一骨碌滚到坡底。幸亏球高草肥,安然无恙。更幸亏马镫没有挂住我的右脚,要不然写不了这篇博客了。

还好马儿有良心,一路减速后停下来等我。爬上去继续飚了几趟。总的来说是很过瘾的。以40~60公里/小时速度策马狂奔在潮白河干涸的河床上,耳边狂风尖啸。或者在河边的杨树林里,时时低头躲过树枝,或者干脆就让一些小树枝抽在前胸和肩膀上,触摸着它们的寸断,yy一下自己的强壮。

特别需要总结一下,马镫长度要够,身体重心要稳,绝对不能像站在马背上一样骑马。尤其是体重像我一样在170斤及以上的朋友们,千万记着,其实马们比我们重不了多少。如果人的重心不够低,平衡保持不够稳,再带着马儿不走平路,那就是对马儿和自己的身体健康不负责任了。

刚回到家,热水洗澡,巴掌大一块屁股磨破了,裤子倒霉了,硫磺香皂用上,洗掉血水后白嫩嫩的一片,和周围的黑皮肤一映衬,恍惚间如同回到了婴儿时代。