Monthly Archives: April 2007

山有扶苏

  翻《诗经》,看到下面这首笑起来。原来那个时代女孩子是这么揶揄自己男朋友的:

  山有扶苏,隰有荷华。不见子都,乃见狂且。

  山有乔松,隰有游龙。不见子充,乃见狡童。

  翻译过来大概就是:“山上有扶苏树,水里有荷花。没见到帅哥,偏遇着你这坏瓜。”

恐龙、pFind和商业

  科学家从6800万年前的暴龙化石中成功鉴定出了胶原蛋白,蛋白分析结果也进一步佐证了鸟类起源于恐龙的进化理论。论文发表在2007年4月13日出版的Science(VOL 316 SCIENCE 280-285)上。鉴定这些胶原蛋白用的是离子阱串联质谱技术,软件是SEQUEST。文章后面说:

  “The fact that sequenceable collagen was very abundant in the mastodon sample, which could be approximately half a million years old, also sheds light on the fact that sequenceable protein lasts much longer than 1 million years.”

  还提到,即使没有基因组序列,质谱技术和生物信息学也可以有所作为:

  “As technologies become more refined and protein extraction techniques are optimized, more informative material may be recovered. This holds promise for future work on other fossil material showing similar preservation, but also demonstrates a method for obtaining protein sequences from rare or endangered extant organisms whose genomes have note been sequenced. The MS- and bioinformatics-based approach we have used can be applied not only to obtain sequences from extinct organisms, but also to obtain protein sequences from extant organisms whose genomes have not been sequenced and to discover mutations in diseased tissues such as cancers.”

  希望有一天,生物学家在Science、Nature或Cell上发表这种有趣的牛文章时能提到pFind的名字。

  明天去北京蛋白质组研究中心。最近连续去合作单位,请生物学家试用。用户认为pFind有望超过SEQUEST。至于Mascot,其实算法也可以比,但工程细节上差距不小。我们的现实问题是科研人员精力有限,软件开发效率不高,团队无法做到快速反馈迭代。

  昨天写email:要保证软件开发质量,就需要职业软件工程师,就需要钱。pFind想更进一步,尤其是着眼海外市场的话,必须按游戏规则来玩,我们得考虑用商业机制来推动了。

Second Life体验

  大概是因为核武器事件,最近Second Life受关注。今晚用电脑发现老娘居然也装了一个。偷偷用她的帐号登录体验一下。刚进去也不会干什么,主要在测试各种操作。大概明白了,这不是传统的在线游戏,更像一个3D虚拟社区,初级的Matrix。

  在Second Life遇到的第一个人,他造了付很酷的翅膀。我也想试着造个东西出来,折腾了一阵,搞不定Build命令。

  刚刚学会飞,还不会降落,想下到地面走路时摔了一个大跟头。

  继续到几个大公司的地盘去看看。

  IBM的会议中心在一个岛上,可我没有找到有关虚拟紫禁城的指引。IBM的员工团队是Second Life里面最活跃的,世界各地有十多个小组都在Second Life里买了房产,建立了虚拟交流中心。

  路透社Second Life分社大楼,可里面有太多楼梯和柱子,飞的时候总会碰到头。完全照搬现实世界就失去想象力。

  adidas公司门口的机器人,不过里面很简陋乏味。

遇到King了

  调查国内质谱仪器的市场现状,找了半天,只见到这么模模糊糊一句话:“2004年进口色谱—质谱仪器600余台,总价值近一亿美元,是进口数量较大的分析仪器中价格最昂贵的一种。”

  这当然远远不够,需要更精确的比例和趋势,比如:仪器类型(离子阱/QTOF/FT……)、用户(企业/科究院所/分析测试机构)、用 途(研究/制药/能源/化工/医疗)、使用强度(支持多少实验人员,每周跑多少数据),服务形式(内部自用/对外服务)、预算结构(软/硬件)等等。

  搞清这些,我们才能估算出几个重要问题的答案:软件免费升级的期限多长合适?如何计算多核系统的licenses?算法订制开发的接单下限应该是多少钱?Web Service形式有没有推广空间?

  杀到海关总署的网站去查。原来人家要收费,查单项商品的进口额,一次2元。那么想知道“色谱仪及电泳仪”和“其他质谱仪”两种商品在06年的进口总额,就要花4元,似乎还可以接受。再试试逐月统计,一下变成48元了。点到收款台,居然用打印或光盘的形式速递,速递费最少20元。

  什么叫Data is King,垄断部门赚钱真容易,Wuwu~

匈牙利命名法和国际空间站

  上班路上在轻轨里看《参考消息》,新闻里有个名字挺眼熟:Charles Simonyi,到实验室上网一查,果真是匈牙利命名法的发明者。

  如今Windows程序员广泛使用的类型前置变量命名规范,就是Charles Simonyi在博士论文中提出的,由于他是匈牙利裔,所以被称为匈牙利命名法。作为微软前首席架构师(Chief Architect),Word和Excel的主要设计者,Charles Simonyi现在自然也是亿万富翁。

  新闻上说,昨天他从俄罗斯发射升空,进入国际空间站,成为第5个花2000万美元遨游太空的游客。

  BTW1:花钱上太空的,除了Charles Simonyi,还有Ubuntu Linux创始人Mark Shuttleworth,那个南非人。IT业的创业者不是最有钱的,却是最能折腾的。

  BTW2:南非IT业很牛,比如腾讯(QQ),50%股份就属于南非股东。

多核时代

  年初Intel发布了试验性的80核CPU。16核龙芯正在计划投入实用。其实尚在开发中的最新一代龙芯(GodsonT)走得更远。春节前,生物信息组的代码在上面试跑过一次,都把我吓傻了,他们居然还觉得“达不到期望”,还在大改。IBM的千核CPU(Kilocore)也披露了。

  自从C++委员会主席Herb Sutter发表The Free Lunch Is Over: A Fundamental Turn Toward Concurrency in Software,JAVA神童Rickard Oberg表示赞同后,软件业似乎一瞬间就进入了多核并发时代。从纯技术角度看,近五年最激动人心的创新是什么?不,不是.net或AJAX,而是GFSMapReduce

政由葛氏,祭则寡人

  周末在家乱翻书。《二十四史》水平有高有低,一个有趣的规律是,若写历史的人和统治者不合,写出的东西就特别好看。例如司马迁的《史记》、陈寿的《三国志》。

  诸葛亮在世时,人皆不敢直言指斥。到他一死,丞相参军、安汉将军李邈即上书后主刘禅:“吕禄、霍禹未必怀反叛之心,孝宣不好为杀臣之君,直以臣惧其逼,主畏其威,故奸萌生。亮身杖强兵,狼顾虎视,五大不在边,臣常危之。今亮殒殁,盖宗族得全,西戎静息,大小为庆。”

  所谓“狼顾”,《晋书·宣帝纪》云:“魏武察帝有雄豪志,闻有狼顾相,欲验之,乃召使前行,令反顾,面正向后而身不动。因谓太子丕曰:‘司马懿非人臣也,必预汝家事’”。司马懿和诸葛亮被时人看成有“狼顾”相,有篡位的野心。

  《三国志·李严传》注引《诸葛亮集》:“严与亮书,劝亮宜受‘九锡’,进爵称王。”诸葛亮答书曰:“若灭魏斩睿,帝还故居,与诸子并升,虽十命可受,况于九邪。”《汉书·王莽传》:“宗臣有九命上公之尊,则有九锡登等之宠”,众所周知,九锡非人臣之常器。汉制,非刘氏不封王。三国时曹操封魏王,加九锡。刘备自加九锡,称汉中王。孙权受魏主曹丕九锡,称吴王。诸葛亮云“十命”,比李严劝进九锡更上一层,毫不掩饰。

  诸葛亮在《前出师表》告诫刘禅, “宫中府中俱为一体,陟罚臧否,不宜异同……不宜偏私,使内外异法也”。宫中之事也要交给相府来管,若不答应就是“内外异法”了。一连讲了好多“宜”怎样 “不宜”怎样,口气严厉,尤其是“宫中府中俱为一体”,把丞相府的地位同皇宫地位并列等同。

  举荐将军向宠“为督”,“营中之事,悉以咨之,必能使行陈和睦,优劣得所”,此前禁军统领是老将赵云,带其出征,换成了自己的心腹向宠。后来又“虑后主富于春秋,朱紫难别”,故特派侍中董允“领虎贲中郎将,统宿卫亲兵”,掌管御林军。“愚以为宫中之事,事无大小,悉以咨之,必能裨补缺漏,有所广益”。监视刘禅一举一动,弄得 “后主益严惮之”。