Author Archives: wangleheng

关于贝利的乌鸦嘴

  作为上一篇BLOG的补充读物。

  1990年:以红星队为班底的南斯拉夫队,拥有三个火枪手以及苏克、博班等新星,阵容空前绝后。贝利预言南斯拉夫队能打入四强,结果球队首场就被德国4比1修理,最终死在阿根廷手里,止步八强。

  1994年:贝利预言“哥伦比亚将是冠军的有力争夺者”。曾经5:0横扫阿根廷的哥伦比亚小组未能出线,后卫埃斯科巴还因乌龙球,回国后被狂热分子枪杀。

  1998年:贝利预言“西班牙和巴西进入决赛,巴西夺冠”。西班牙小组未出线,含恨而死。巴西决赛0比3惨败法国。

  2002年:不管记者如何挑逗,贝利打死也不评价巴西队,反而把众多世界强队全部赞美了个遍。“世界杯冠军将在阿根廷和法国两队之间产生。”。结果国际足联积分排 名前两位的球队在小组赛双双出局。要知道当年的欧洲三大联赛的三个最佳射手都是法国人,卫冕冠军揭幕战就被第一次打进世界杯的塞内加尔干掉,小组赛居然一球不进。此后淘汰赛中,贝克汉姆们状态出色,英格兰3比0大胜丹麦后遭遇巴西,贝利挺身而出,预言“英格兰将夺冠”……在贝利杀伤力极强的乌鸦嘴的掩护下,巴西最终夺冠。

  这一次呢,等着瞧吧。

The young man knows the rules, but the old man knows the exceptions.

  法学家Oliver Wendell Holmes的名言。很多时候,逻辑无法替代经验。

  经理人总想找到一种通用的解释,一种可靠的信仰。翻翻书店里的管理书籍,几乎每本都提出一种万能“银弹”,摆出“麻烦到我这儿就结束了”的架势来。郁闷的是,到目前为止,这些方法的有效性和贝利对世界杯的预言差不多。

  这并不意味着理论就毫无可取之处。事实上无论是“战略规划”、“企业文化”、“执行”还是“蓝海战略”,都是由商业竞争中最出色的胜利者提出的概念。但这个领域远没达到完善,甚至还不能称为严格意义上的科学。单纯读再多经典,也变不成像作者一样出色的经理人。足球赛偶然性太多,贝利也说不清楚。

  要掌握管理,还是只有亲身实践一种途径而已。

Google黑板报上的离散数学

  从高中时代的香港那届全国计算机奥林匹克比赛算起,不断参加了不少与离散数学有关的考试。

  最近不打算写blog,准备在职硕士学位申请考试(还是有离散数学)。没想到在Google黑板报上看到离散数学的入门普及,登上来引用一下。

  本以为Google黑板报是面向有经验的软件开发者的PR,会讨论更高端的东西。比如挖keso过去;或者写写类似MapReduceGFSBigTable这样的技术;又或者组织个沙龙什么的。没想到内容是这样的。坦率说,似乎更适合面向高中生和本科低年级。

  不过这也许就是Google与众不同的地方。如果把开发软件比做武功,离散数学、组合数学、线形代数和数据结构这几样,就是《九阴真经》上册。上册内功呼吸没修行好,后面的拳脚身法容易走火入魔。

FDR

  前几天都在用蛋白反转库测试pFind的FDR。征用了N台服务器和PC,成天咕噜咕噜跑,CPU100%,其他啥也干不了。

  喝完同学的喜酒,去实验室看假阳性实验的进展,果然跑完了。拷回来分析,和对手不分上下。这次pFind打分算法没加误差模型。刚好碰上fy,帮我把误差参数训练出来,又开始跑。估计5月4日能出结果,希望效果更好一点。

blog的spam过滤技术

  发现有站点利用blog的引用通告发布了大量垃圾广告,登上来删了好半天。

  这个爬虫先搜索每篇blog,寻找特定的关键字,然后根据关键字提交不同的引用通告。这种类似Google广告的方式比垃圾邮件的变化多一些。看来不久就会出现针对blog的spam过滤技术了。

C++应用程序和C++库

  引用孟岩的好文:

  “…… 现在我们知道,用来写C++程序库所需要的技术,与用来写C++应用程序所需要的技术存在很大的差别。这已经比较糟糕了。更糟糕的是,一般的C++开发者 根本分不清这中间的差别,他们在开发中往往既不是一个称职的程序库开发者,也不是一个单纯的应用开发者。他们一边想着完成手头的工作,一边琢磨如何能够写 出高质量的基础库和框架,为万世开太平。如果说C语言是一把轻快的小匕首,遇谁都是进身猛刺,血溅一尺,那么这种C ++的使用方式无异于左手打铁铸兵,右手挥剑刺秦,这种精神分裂的状态直接将很多项目变成了既超期超支又质量低劣的垃圾。“

   “认识到这样的事实之后,C++程序员应当以更理性的态度来看待自己的工作。大部分情况下,你所需要做的是寻找一些可以互相合作的、稳定可靠的开源程序 库,然后在其基础之上,面向目标,使用尽可能简朴的技术,专心专意地进行应用开发,把那些复杂精妙的语言技巧和“可复用”之类的想法扔到Java国去。唯 其如此,你才可能更高效地开发出好的应用软件,而且会逐渐积累和重构出真正可复用的软件。”

停blog的感觉

  停了两周,优化作息时间,集中精力。感觉不错。不断改进pFind系统

  朱辉龙描述很贴切:“……订阅的feed与自己feed的责任感,让我经常凌晨2-3点睡觉的时候,对自己今天还没有写blog叹气,负罪、内疚、压迫感,在午夜依然不能入眠……”,乐趣变成了一种压力,该调整调整了。

  不过,我并没失去敲键盘的乐趣。阅读和网摘的时候,还是会不断闪念头:“有意思,这个可以写到blog里”。好多有价值的见闻和想法,当时不记录,淡忘得很快,过几天想写都没味了。

  BTW1:正在忙买房子,感谢波波这两天给我帮的大忙//bow,某人的自私冷漠伤人心。

Redhat收购JBoss

  之前JBoss拒绝了IBM和Oracle两个大佬,看来文化的认同和商业模式的匹配更为重要。

  另外一方面,Redhat和几个巨头的关系开始微妙起来。在这之前,Redhat是以IBM为盟主的反微软阵营扶植起来的过河卒。这次闯入企业级中间件市场,意味着会与以前罩自己的老大发生正面冲突。

  把最近频繁的收购联系起来看,大鱼开始吃小鱼,软件市场空间在缩小。谁能幸存成为战国七雄?

Google的算法

  开始设计pFind系统的集群版本。今天在读Google的论文:MapReduce: Simplified Data Processing on Large Clusters。之前推荐过The Google File SystemWeb Search for a Planet: The Google Cluster Architecture两篇论文。

  Google的强大不只源于PageRank算法,用普通PC组成的高效集群也是一个杀手锏。李开复就提到过,MapReduce算法和GFS架构才是Google真正的核心竞争力。

  digg上热炒Google购买Orion算法的的事。引出一大堆各式各样的八卦议论,比如有关这个博士生的国籍。有个小伙这么写“After all Israel is just America III. Canada is America II.”,哈哈。

  有趣的是,现在,北京时间2006年4月10日22:30分,用Google Web Search搜索这个新闻,可看的内容很少,但用Google Blog Search搜索,就能找到世界各地用各种语言写的评论,很多都是20分钟前刚写的。