Category Archives: 流水帐

我结婚了

  BLOG是一种广播式媒体,最好发表对别人有意义的独立内容。一般情况下,我更喜欢在BLOG角落里用春秋笔法藏些私人生活方面的蛛丝马迹。不过结婚这件事,还是别玩弯弯绕,向朋友们公开交代比较好。

  2月17日在摇晃的地铁车厢里求婚的时候,还有挑选婚戒规划婚事的时候,俺就知道5月份会过得很艰难。得全力以赴赶上工作生活中的各种deadline。昨天领完结婚证,还以为纠结的5月终于可以画上一个比较圆满的句号了,结果……今天一早出门去丈母娘家,事情还没完呢。

  幸运的是,俺能找到zhw这样一个合适的爱人。根据英国人的科研论文,概率是二十八万五千分之一

  我们计划下月去马尔代夫蜜月旅行。

  感谢每个帮助、宽容我的亲友。特别感谢Queen美女在胜负未分时提供的关键火力支援,她帮我挑选的香水礼物是名副其实的杀手锏。

丽江流水帐

  昨天上午Boss H和Sun老大的报告,那是相当成功。顿时走到哪里都听到pFind。有刚购买Mascot的用户悲叹现在才听说pFind;很多场合都有人要求我们举办培训;还有软件分销公司来找Boss H交换名片,希望代理销售pFind Studio。

  昨晚973会开到零点。此前,Boss H修改PPT连续两天熬夜到3:00;而Sun老大试用pFind到深夜,凌晨2:00又起来继续改PPT……我还以为他们过分勤奋。结果昨晚一听,老板们各个都不是吃素的:白天在大会上生龙活虎,晚上还克服2000米的高原反应通宵修改973材料。这帮科学家真的都是铁人,我服了。

  今天,在茶马古道骑马,在拉市海划船,在束河古城的长廊里发了四十分钟呆,在一个叫“第八号火柴盒”的小店里和美女店主一起喝普洱茶。休闲真是好奢侈。(回来一收邮件,又是一脑门子事)。

  幸运找到了蹭团机会,明天去玉龙雪山。刚刚和老妈通电话,她说“几年前我去玉龙雪山玩的时候,一个多小时就爬上去了,哪里有什么高原反应”。这个,如果我爬不上去就要丢脸了。

头晕和踢踏舞

  最近我把pFind搜索引擎的并行版逐步由传统“单Master/多Slave”模式向多Master的机制重构,Master的模式很接近 MapReduce。这是为了提高千核CPU并行下的I/O效率。两周前又着手准备pFind Studio 2.4的发布。累坏了。上周六开始偏头痛,周一凌晨甚至从梦里疼醒过来,早上10点才爬起来。这几天脑袋一直晕晕的。硬扛。

  经过周扒皮对长工们的剥削,pFind Studio 2.4的Bug逐渐消失。明天Release Candidate版,最后征集意见。

  从昨天开始抓住瓶子双人编程,在集群跟同步异步消息反复纠结。今天下午结果终于对齐了。神清气爽,头也不晕了。晚上回来还停不下来,继续敲键盘重构代码。

  (原来MPI也提供像MPI_Reduce这样的机制,和Hadoop比起来编程细节繁琐些,运行效率还不错,就是老土一点。)

  最近一两年和人打交道比机器多,从Code里体会到的乐趣也没有高中时代写游戏、大学时代hack美女上网密码那么high了。不过我还是喜欢编程,还是为“软件工程师”的称号而骄傲。巴菲特说,只给那些每天跳着踢踏舞去上班的人投资。愿老天保佑俺们和俺们喜欢的工作吧。

朝圣大会里的中国

  昨天Berkshire股东大会(不如说是朝圣大会)刚结束,满网都是帖子了。

  Buffett和Munger两个老爷子的口才还是那么犀利,高盛的官司当然是提问焦点,但关于中国也说了不少。其中对腐败问题、房地产泡沫、华人赌性的点评,真是惊心动魄。

刺猬的两个偶像

  上一辈经历坎坷,上山下乡折腾,但老妈说,“每个人都有自己的精彩故事”。而我们以及更小的一代,吃全世界小孩都吃的KFC,看全世界小孩都看的Big Bang,玩全世界小孩都玩的星际2试用版,抢全世界小孩都抢的工作职位……这是前N代华人没有的幸福,也是一种致命的压力。对俺们来说,最重大课题就是必须搞清楚“我是谁,和其他人有啥不同”。

  马齿渐长,过了三十岁,同辈的朋友开始变:找到自己使命的,都安静下来不再焦虑了。

  说说俺的两个偶像:

  当初yang姐因某知名外企不准穿牛仔裤上班,愤而鄙视之,转投去了Google。每隔一段时间再联系,她总有成长。最近虽然公司卷在漩涡里,但yang姐嫁了人(恭喜,怨念),还支起了自己的iPod/iPhone软件生意,个人气场持续稳步增强。

  wl在2002年本科一毕业就果断买房,薪水减去房贷只剩几百块吃饭了。那时候班上其他同学根本没这根弦。反而到去年经济危机最厉害的阶段,他却卖掉了房子和汽车,开张了自己的女鞋买卖。现在也是做几十万流水的人了。

  我一向迟钝。yang姐提她的软件和Google AdWords时,Object-C还不像如今这么红得发紫;wl讲解女性消费,俺只能勉强跟得上。嗅觉灵敏的强人永远走在平庸之辈前面,悲剧呀。

  也好。连岳在一次访谈里讲:“我很晚熟,三十岁才差不多成熟”。这话给我不少信心。做不了狐狸,就老老实实做一只好刺猬吧。(也许是鸵鸟?哈)

容错、书单、pFind和pNovo的国际初show

  今天加班有点累。掐着点坐末班地铁回到家。喝水休息。又好一点了。上来随便敲点,放松一下。

  wyj美女正在跑超大规模的实验,我要帮她完成一部分。但最近时间紧张。今天索性抓她一起完成,交叉检查避免疏漏。到晚上22点,384组实验的参数总算全设置完了,我们都接近崩溃。然而,跑起来,集群速度不正常。瓶子帮忙检查了好久。有些灯枯油尽,又要赶地铁,明天再继续。

  感觉是硬件问题。最近某个节点似乎一直在“带病坚持工作”:也不彻底死机,就是超级慢。遇到这种问题Google系统的常规做法是把长时间“不归队”的节点放弃掉,将其任务重新平分给其他各节点。pFind目前对此还没啥特别措施,Mascot、SEQUEST和X!tandem等竞争对手的集群版也没考虑。

  可用性应该是云计算设施的基本要求,也许比速度甚至精度还重要。算算概率,Intel
CPU理论上连续运行10年出现一次浮点计算错误,这就意味着上千核的集群每2小时就错一次(还没考虑其他更容易出问题的部件)。也就是说,在大规模的廉价商业集群上长期运行的软件,必须把硬件错误当作常规事件,考虑对应的鲁棒性设计。Google就强调GFS、MapReduce和BigTable的最牛之处并不是峰值速度或数据吞吐量,而是其在廉价集群硬件上的稳定性和容错能力。

  跑题,列点最近几天新买的书:《Search Engines — Information Retrieval in Practice》《Out of Mao’s Shadow》《一九八四》《伊斯坦布尔——一座城市的记忆》《一个人的电影》。发现前两本英文书居然看得最快。第二本书,是hchi去美国参加RECOMB Satellite Conference on Computational Proteomics 2010给带回来的。走之前他问我要带什么。我随口说:“带本书吧”。结果他就千里迢迢从美国带回来一本华人写中国的英文书。我该早预计到这个结果的。当然,书是好书,还是要感谢。

        

  顺便自豪一下:这次rxsun老大参加iPRG 2010磷酸化数据鉴定评测,pFind引擎在全世界人民面前一鸣惊人了一把。而hchi哥的pNovo更是让de novo算法的主流人物服气了。(伟大的hchi哥进入de novo领域才半年,真快。)

拿着马桶搋子的疯狂兔子

  没按承诺写BLOG总结新人工程的培训经验,忏悔,稍等几天。

  论文Revision终于收到邮件,继续Major Revision,编辑和评审人都说俺英语烂,开始第23稿。

  我和hchi都没顾上申请专利,他要赶在去美国做报告之前,而我要赶在论文正式发表之前。

  昨天早上家里马桶堵了,杀到建材市场买到高科技的真空搋子,搞定,然后奔到单位上班。

  像WII里拿着马桶搋子的雷曼兔子(Rayman Raving Rabbids),疯狂忙碌中。

toy61.com购物体验

  和昨天一样,单位没什么人。午饭前上来敲点东西。

  我是emileyuan的博客的长期粉丝。以前说过,有机会一定要去她店里买玩具。她最近建立了电子商务网站toy61.com,前两天拜年需要给小朋友买礼物,就去体验一下。

  浏览网站,感觉开发人员的技术能力不弱。春节前一周定了“迪奇集装箱卡车”,下单后送货及时(北京地区)。玩具本身令人满意。

  有些细节值得注意:

  1. 导航,区分不同需求(例如性别和年龄)想法很不错。可功能实现并不细,仍然得点N次鼠标才能找到合适的玩具。缺少更实用高效的搜索或向导。
  2. 说明,图片不清楚,文字也有点乏味冗长。
  3. 购物车,商品不会自动过期。过几天再来,如果这种玩具已无库存或不再销售,它条目还在购物车里,点进去显示“该页面不存在”。
  4. 结款,“满200元免快递运费”。但快递运费不会自动计算和扣除,得由用户手动去掉。没有明确提示,用户会犹豫,怕去掉就变成“平邮”。
  5. 收货,打开盒子,保护玩具的泡沫塑料纸没裹上,而是塞在旁边。还得检查玩具没有损伤才敢签收。

  搭起网站框架,应用先进的IT技术,建立整套物流体系,这还不直接等于用户很舒心。希望toy61.com不断完善,让我们享受到更多为小朋友购买玩具的乐趣。

中国队赢了,以及Google“巴子”

  刚看完中国队3:0战胜韩国队的足球赛。上来就为了写一个字:爽。尤其是最后一个球,曲波和邓卓翔两个人连续N次神奇过人,直接就把李云在踢哭了。

  试用了Google的“巴子”,想凭借这个战胜t和f有点难。却加重了我对Gmail的忧虑,现在设置为自动转发hotmail做备份。可是Hotmail好难用啊。