Tag Archives: 豆瓣

赞一下豆瓣bubbler

  赞一下豆瓣新推出的bubbler,这才是好产品。据说是实习生做的,牛。这么多年过去,我依然是无可救药的重度豆瓣粉。

  最近特忙,没怎么听豆瓣FM。今晚一听效果特好:它推荐给我的都喜欢,同时这些曲目大都是最近新发行的专辑,我都没听过。豆瓣的数据挖掘算法和推荐系统越来越成熟精致。

  记得刚开始用豆瓣FM的时候,一跳出梁静茹和孙燕姿的歌,我就知道是因为某两个家伙在我好友名单里,所以算法推荐了这些歌。

  前一阵还有个帖子被大量转发:一个单身女孩29岁生日那天,在微博上哭诉:“豆瓣的算法凭什么推荐一本《30岁前别结婚》给我!”

跟上

  又来杭州开会了。zw说我像打了鸡血一样。

  《社交网络》里Mark Zuckerberg对好朋友Eduardo Saverin说,快过来和我们一起,要不然你就落下了,我需要你。可是后者始终没听懂。他连自己的Facebook主页都不会改。那种连接起来发生共振的感觉,敲代码入魔的感觉,从二楼滑入水中胡闹的感觉,他始终没法真正体会。

The Social Network

  下面视频源于豆瓣的版本管理系统里面的代码提交记录。那些大名鼎鼎的ID头像,以及周围烟花般绽放的代码,羡慕嫉妒恨。视频是由Code Swarm制作的,具体技术参考Xupeng的BLOG

流水帐.2009.11.11

  压力很大,有段时间没有写BLOG的心境。修养不够,乱发火,还需要磨练,还需要反省,还需要成长。

  投稿Journal of Proteome Research,被传说中的副主编不经同行评审直接拒稿。yb打电话聊天,安慰:有些人就是怀疑,认为中国大陆做不出那么出色的科研成果。其实还好,还好。宁愿相信是自己做得还不够牛。即使真涉及技术外的因素,是不是歧视,取决于你最终到底做成什么样。姚明得分超过30,巴克利就该kiss驴屁股,否则人家就是有先见之明。短暂抑郁,转投Rapid Communications in Mass Spectrometry。这次遇到的责任编辑还是06年投稿的那位,很快就进入peer review了。fy老大催着赶紧申请专利,否则文章一发表,就来不及了。

  瓶子哥在曙光5000A上测试,320核条件下,加速效率达到80%。欣慰。这段时间的交流,意识到随着分布式规模的扩大,pFind集群的特点逐渐向I/O密集型靠拢。也就是说越来越像web搜索引擎。明年要搞点MapReduce的尝试。另外购买4000块的昂贵显卡。一直在关注GPU在科学界的应用。生物制药、物理航天、天气地质、游戏娱乐……短时间出现了爆炸性的增长。计算机行业的一个有趣的特点就是,工业界常常跑在前面,搞出一些破坏性创新,给学术界造成了很大的压力。

  雪下得好大,积雪没过了鞋帮,咯吱咯吱的。大家注意身体,别H1N1。今天见到了好久没联系的jw。原来是班车11点还因为大雪堵在路上,他索性下车到我们这里交流。忙过这一阵,要去看看朋友们。当然,还是会逼着大家给pFind引擎提意见。

  在各种场合听到关于创业的讨论。创业当然主要跟钱有关,但是必须有一点钱以外的东西。Boss H说得对,一时的热情最容易消散。必须有点功利以外的理由,让自己在最痛苦时平静下来,坚持下去。

  douban.com在测试“豆瓣电台”,根据你的历史行为推荐音乐。上来就给我推荐了几首没听过的张震岳、周杰伦和涅磐。查了查,豆瓣在招聘“算法和数据挖掘专家”。应聘要求包括:“热爱探索和钻研,相信算法能够改变人们的生活;极佳的逻辑分析能力和学习能力,善于应对各种智力挑战;熟悉海量数据处理和挖掘的基本算法, 或有高性能科学计算的相关经验”。

豆瓣新九点、pFind小品和团队氛围

  不好意思,最近寡人有疾。没上班也没上网,在家狂吃狂睡、翻书、看游戏风云频道。思维处于空白状态,BLOG也就一直没啥内容可分享。

  豆瓣的新版九点上线,试用了一下。刚刚把我的Google Reader的OPML列表导入九点阅读器,相比06年从bloglines导入Google Reader,麻烦少多了,也有部分feed抓不到。打算体验两者的自动推荐功能,看看谁的数据挖掘算法更贴心。

  今天恢复上班,组里的年轻人正在排练话剧,俺当了一下午的场记和剧务。故事的结局当然是略显木讷的pFind击败了趾高气昂的Mascot和SEQUEST。袖子哥还有一段激情澎湃声嘶力竭的“它不是一个人在战斗!”,那是相当雷人。大家别错过正式演出呀。

  前一阵JDL考核,有评委对我说,你有没有意识到,你的个人风格,正是你们组的特点:踏实、勤奋、有激情,但有些细节上喜欢钻牛角尖……团队成员不能太相似,还是不同性格和能力时时碰撞互补比较好。

本周收藏.2006.03.12