列书单.2010.7.1

  去马尔代夫前一天,到光合作用买了奥利弗·萨克斯的《错把妻子当帽子》、艾丽丝·门罗的《逃离》、卡普钦斯基的《与希罗多德一起旅行》以及春树的《光年》

  回到北京后,又从中关村图书大厦买了佩措尔德的《编码》,Andrew Stellman等人的《团队之美》、Till Adam等人的《架构之美》、冯·诺意曼的《计算机与人脑》、朱光潜的《谈修养》

马尔代夫

  我在Google Map上找到了这次渡假的两个小岛KurumbaVelassaru

断网断电话一段时间,还有pFind的千核并行进展

  从明天开始,我在一段时间内无法上网,也无法接听电话。

  顺便说说pFind Studio进展。最近hf和xs在全力完善pBuild 2.0。稍后我们会向全球用户群发邮件,邀请大家试用最新版本。另外,于上个月在深腾7000超级计算机上刚完成的实验中,pFind千核并行取得了满意的加速比。瓶子哥正在拼搏(站好最后一班岗),在2048核处理器规模下试验更大规模的数据。

  俺们算初步解决了多修饰海量谱图的高效并行加速问题。用户可以选定15种之多的修饰,或者把母离子误差开到500Da之大,pFind百核集群都能在常规时间内完成搜索鉴定。而现有的公开报道中,世界上其他竞争对手超过32核加速效率就会变差。大言不惭地说,俺们在并行加速方面获得领先。

  但仅考虑海量谱图是不够的,如果面对超常的巨型蛋白质序列库(例如直接搜索人类基因组数据,或这两年很热的用恐龙化石中提取的蛋白质搜索全生物库的需求),主流搜素引擎目前还都无法做到有效并行。仔细分析可知,这种情况下搜索引擎的运算特点就从以计算密集型为主,转为计算密集型和I/O密集型兼有,接近Web搜索引擎。也就是说,Google MapReduce那一套有用武之地了。

我在kanrss上的帐号是@joyfire

  我在KanRSS上的帐号是@joyfire。这是老张stdyun.com之后的新进展。作为教主的忠实粉丝,俺自然要追随。站点还在开发中(代码开源在Google Code),目前里面注册的还只是刘未鹏云风Fennglimodou郑昀刘江阿北Tinyfool一众人等。

  昨天端午节,某人带着她的17双高跟鞋归顺于我,自此天下大定。

  准备出发。不过印度洋又地震了,俺却不会游泳,订的还是水上屋……纠结啊。

我结婚了

  BLOG是一种广播式媒体,最好发表对别人有意义的独立内容。一般情况下,我更喜欢在BLOG角落里用春秋笔法藏些私人生活方面的蛛丝马迹。不过结婚这件事,还是别玩弯弯绕,向朋友们公开交代比较好。

  2月17日在摇晃的地铁车厢里求婚的时候,还有挑选婚戒规划婚事的时候,俺就知道5月份会过得很艰难。得全力以赴赶上工作生活中的各种deadline。昨天领完结婚证,还以为纠结的5月终于可以画上一个比较圆满的句号了,结果……今天一早出门去丈母娘家,事情还没完呢。

  幸运的是,俺能找到zhw这样一个合适的爱人。根据英国人的科研论文,概率是二十八万五千分之一

  我们计划下月去马尔代夫蜜月旅行。

  感谢每个帮助、宽容我的亲友。特别感谢Queen美女在胜负未分时提供的关键火力支援,她帮我挑选的香水礼物是名副其实的杀手锏。

列书单.2010.5.28

  最近很多行政上的繁琐手续,有点累。前两天在光合作用买了几本书。包括村上春树的《1Q84》格雷尔·马库斯《老美国志异》上次买的《奇鸟行状录》还没读完,结果先把《1Q84》一口气读完了。我发现年纪越大,村上春树的故事就越有战斗性。之前刚买的翁贝托·埃科的《玫瑰的名字》也一点一点在看,还没看到最精彩的部分。

pFind集群的论文正式发表

  俺和瓶子的pFind集群论文:An efficient parallelization of phosphorylated peptide and protein identification已在英文期刊RAPID COMMUNICATIONS IN MASS SPECTROMETRY (2.772)正式发表。

  论文主要论述了我们在并行加速方面的研究。实验表明:pFind搜索引擎对一个含有100个Raw文件的磷酸化公共数据集进行鉴定,在100个处理器核 上,加速比为83.7;对另一个更大的、共含有1,366,471张质谱的磷酸化数据进行鉴定,在320个核上,加速比为258.9,加速效率达到 80.9%。

  目前pFind并行版已经投入一线分析实用。俺们正在千核条件下继续研发。

丽江流水帐

  昨天上午Boss H和Sun老大的报告,那是相当成功。顿时走到哪里都听到pFind。有刚购买Mascot的用户悲叹现在才听说pFind;很多场合都有人要求我们举办培训;还有软件分销公司来找Boss H交换名片,希望代理销售pFind Studio。

  昨晚973会开到零点。此前,Boss H修改PPT连续两天熬夜到3:00;而Sun老大试用pFind到深夜,凌晨2:00又起来继续改PPT……我还以为他们过分勤奋。结果昨晚一听,老板们各个都不是吃素的:白天在大会上生龙活虎,晚上还克服2000米的高原反应通宵修改973材料。这帮科学家真的都是铁人,我服了。

  今天,在茶马古道骑马,在拉市海划船,在束河古城的长廊里发了四十分钟呆,在一个叫“第八号火柴盒”的小店里和美女店主一起喝普洱茶。休闲真是好奢侈。(回来一收邮件,又是一脑门子事)。

  幸运找到了蹭团机会,明天去玉龙雪山。刚刚和老妈通电话,她说“几年前我去玉龙雪山玩的时候,一个多小时就爬上去了,哪里有什么高原反应”。这个,如果我爬不上去就要丢脸了。

pFind Studio 2.4开始下载了!

  半夜1:30时xs发来新版pBuild。凌晨6:00时kzh和hchi哥发来新版pLabel。又经过今天反复折腾,晚上22:00,伟大的fan博庄严宣布:pFind Studio最后一个已知Bug测试通过。热泪盈眶中。

  欢迎大家到pFind官方网站注册并下载软件

  这两天像炼狱。前天sun老大在首都机场T3起飞前还在测试。昆明转机时,俺还一个电话接一个电话。到了丽江古城,对旅馆外的风土人情毫无感觉,一头扎进房间打开笔记本,开始上网打电话……发了N多骂娘邮件,今天中午一度有点怀疑人生。多亏hfchen、fan博、hchi、kzh、xs诸位夜以继日,日以继夜的长工最终把事情做成了。

  zhw说:第一次见面就说在对付bug,没想到了丽江这么山清水秀的地方,还是躲在黑屋里改bug。

  明早大家一定要去听Boss H精彩的大会报告呀。英文标题很煽情:pFind made in China: past, present and future.另外sun老大也是报告专家之一。