Monthly Archives: May 2010

我结婚了

  BLOG是一种广播式媒体,最好发表对别人有意义的独立内容。一般情况下,我更喜欢在BLOG角落里用春秋笔法藏些私人生活方面的蛛丝马迹。不过结婚这件事,还是别玩弯弯绕,向朋友们公开交代比较好。

  2月17日在摇晃的地铁车厢里求婚的时候,还有挑选婚戒规划婚事的时候,俺就知道5月份会过得很艰难。得全力以赴赶上工作生活中的各种deadline。昨天领完结婚证,还以为纠结的5月终于可以画上一个比较圆满的句号了,结果……今天一早出门去丈母娘家,事情还没完呢。

  幸运的是,俺能找到zhw这样一个合适的爱人。根据英国人的科研论文,概率是二十八万五千分之一

  我们计划下月去马尔代夫蜜月旅行。

  感谢每个帮助、宽容我的亲友。特别感谢Queen美女在胜负未分时提供的关键火力支援,她帮我挑选的香水礼物是名副其实的杀手锏。

列书单.2010.5.28

  最近很多行政上的繁琐手续,有点累。前两天在光合作用买了几本书。包括村上春树的《1Q84》格雷尔·马库斯《老美国志异》上次买的《奇鸟行状录》还没读完,结果先把《1Q84》一口气读完了。我发现年纪越大,村上春树的故事就越有战斗性。之前刚买的翁贝托·埃科的《玫瑰的名字》也一点一点在看,还没看到最精彩的部分。

pFind集群的论文正式发表

  俺和瓶子的pFind集群论文:An efficient parallelization of phosphorylated peptide and protein identification已在英文期刊RAPID COMMUNICATIONS IN MASS SPECTROMETRY (2.772)正式发表。

  论文主要论述了我们在并行加速方面的研究。实验表明:pFind搜索引擎对一个含有100个Raw文件的磷酸化公共数据集进行鉴定,在100个处理器核 上,加速比为83.7;对另一个更大的、共含有1,366,471张质谱的磷酸化数据进行鉴定,在320个核上,加速比为258.9,加速效率达到 80.9%。

  目前pFind并行版已经投入一线分析实用。俺们正在千核条件下继续研发。

丽江流水帐

  昨天上午Boss H和Sun老大的报告,那是相当成功。顿时走到哪里都听到pFind。有刚购买Mascot的用户悲叹现在才听说pFind;很多场合都有人要求我们举办培训;还有软件分销公司来找Boss H交换名片,希望代理销售pFind Studio。

  昨晚973会开到零点。此前,Boss H修改PPT连续两天熬夜到3:00;而Sun老大试用pFind到深夜,凌晨2:00又起来继续改PPT……我还以为他们过分勤奋。结果昨晚一听,老板们各个都不是吃素的:白天在大会上生龙活虎,晚上还克服2000米的高原反应通宵修改973材料。这帮科学家真的都是铁人,我服了。

  今天,在茶马古道骑马,在拉市海划船,在束河古城的长廊里发了四十分钟呆,在一个叫“第八号火柴盒”的小店里和美女店主一起喝普洱茶。休闲真是好奢侈。(回来一收邮件,又是一脑门子事)。

  幸运找到了蹭团机会,明天去玉龙雪山。刚刚和老妈通电话,她说“几年前我去玉龙雪山玩的时候,一个多小时就爬上去了,哪里有什么高原反应”。这个,如果我爬不上去就要丢脸了。

pFind Studio 2.4开始下载了!

  半夜1:30时xs发来新版pBuild。凌晨6:00时kzh和hchi哥发来新版pLabel。又经过今天反复折腾,晚上22:00,伟大的fan博庄严宣布:pFind Studio最后一个已知Bug测试通过。热泪盈眶中。

  欢迎大家到pFind官方网站注册并下载软件

  这两天像炼狱。前天sun老大在首都机场T3起飞前还在测试。昆明转机时,俺还一个电话接一个电话。到了丽江古城,对旅馆外的风土人情毫无感觉,一头扎进房间打开笔记本,开始上网打电话……发了N多骂娘邮件,今天中午一度有点怀疑人生。多亏hfchen、fan博、hchi、kzh、xs诸位夜以继日,日以继夜的长工最终把事情做成了。

  zhw说:第一次见面就说在对付bug,没想到了丽江这么山清水秀的地方,还是躲在黑屋里改bug。

  明早大家一定要去听Boss H精彩的大会报告呀。英文标题很煽情:pFind made in China: past, present and future.另外sun老大也是报告专家之一。

头晕和踢踏舞

  最近我把pFind搜索引擎的并行版逐步由传统“单Master/多Slave”模式向多Master的机制重构,Master的模式很接近 MapReduce。这是为了提高千核CPU并行下的I/O效率。两周前又着手准备pFind Studio 2.4的发布。累坏了。上周六开始偏头痛,周一凌晨甚至从梦里疼醒过来,早上10点才爬起来。这几天脑袋一直晕晕的。硬扛。

  经过周扒皮对长工们的剥削,pFind Studio 2.4的Bug逐渐消失。明天Release Candidate版,最后征集意见。

  从昨天开始抓住瓶子双人编程,在集群跟同步异步消息反复纠结。今天下午结果终于对齐了。神清气爽,头也不晕了。晚上回来还停不下来,继续敲键盘重构代码。

  (原来MPI也提供像MPI_Reduce这样的机制,和Hadoop比起来编程细节繁琐些,运行效率还不错,就是老土一点。)

  最近一两年和人打交道比机器多,从Code里体会到的乐趣也没有高中时代写游戏、大学时代hack美女上网密码那么high了。不过我还是喜欢编程,还是为“软件工程师”的称号而骄傲。巴菲特说,只给那些每天跳着踢踏舞去上班的人投资。愿老天保佑俺们和俺们喜欢的工作吧。

流水2010.05.05

  RCM把我论文的Proof发过来,刚浏览了一遍,打算明天早上再动手写邮件回信。上来敲点流水帐。

  先八卦一句,Silverlight和.NET负责人在BLOG里宣布跳槽去Google了,MS又得郁闷。貌似从来就没人相信Silverlight会打败Flash。不过最近Google、MS、Apple几个巨头力挺的HTML5和H.264,倒真抢了不少Flash的风头。

  5月15日pFind Studio 2.4正式发布,其中pBuild和pLabel都有巨大变化,更重要的是,这一次Win32单机版会在pFind官方网站上提供免费下载。所以最近都在忙测试和修正Bug。目前BugFree里还有接近20个Bug没改完,压力。不过兄弟们战斗力很强悍,俺还好,还没到砸车吃纸的地步。

  还在抽时间重构pFind引擎的并行版,希望提高在千核集群上的I/O效率。今天倒是跑通了,可结果还没对齐。

  最近临睡前都要读一段《奇鸟行状录》,感觉好多文字很亲切。今晚下班后去光合作用逛。买到了阿兰·德波顿的《哲学的慰藉》《工作颂歌》,许知远的《祖国的陌生人》,翁贝托·埃科的《玫瑰的名字》

      

这帮悲剧的RCM编辑

  刚收到RCM邮件,让我们确认最后排版proofs。这帮悲剧的编辑,又一次弄错,把别人的文章发给我了。俺发邮件过去问,回答说搞错了。总说有些中国科学家不靠谱,看来欧美的也未必能做到100%严谨。

  这论文历程就是一部高潮迭起的悲喜剧呀。像《岁月神偷》里说的,一步难,一步佳。反正,不到最后平平安安公开发表,俺是睡不踏实了。

朝圣大会里的中国

  昨天Berkshire股东大会(不如说是朝圣大会)刚结束,满网都是帖子了。

  Buffett和Munger两个老爷子的口才还是那么犀利,高盛的官司当然是提问焦点,但关于中国也说了不少。其中对腐败问题、房地产泡沫、华人赌性的点评,真是惊心动魄。