Category Archives: 科技评论

KernelTrap,晕

  好久没浏览KernelTrap.org,输入URL都有些内疚。先看到Jeremy Andrews的申明,说他九月份不会更新了,因为要搬家。然后看到一篇Linux: 2.6.16.y Lives On,开头全是历史知识普及(懒,不翻译了):

  “The Linux kernel development model changed a couple of years ago at the 2004 Kernel Summit [story]. At that time it was decided that as a team Linus Torvalds and Andrew Morton [interview] were doing a great job together maintaining the 2.6 kernel, using Andrew’s -mm kernel as a staging area with new features being allowed into the mainline kernel and ultimate stabilization left up to Linux distributions. In March of 2005, Greg KH and Chris Wright began maintaining a -stable patchset [story], accepting small, focused patches fixing real bugs or security issues……”

  这么多久违的人名和补丁包,有点激动。脑子里过电影,都是本科时代的情节:天天关注lkml和-mm更新;逃课去听AKA的内核分析;飞到深圳打工,往盒子里移植linux内核,宿舍的哥们帮我应付点名和作业;超崇拜Robert Love……

  刚听说Andrew Morton去Google了,一晃我的joyfire.net也三年没维护了,晕。这次pFind集群版的是个好机会,可以借此重新熟悉Linux开发。

从Bloglines到Google Reader

  昨天又从Bloglines转回到Google Reader。Bloglines搞丢了我的RSS种子,甚至重新加都加不了。

  Google Reader推出时,我正在选RSS阅读器,试用过几周。那时它的易用性并不好,很多BUG。加上Google被封的频率高,我又不适应标签方式,更习惯传统的树状结构,所以最终选了Bloglines。

  其实就算现在,Google Reader还是有不少缺陷的,比如不能使用中文标签。若不是Bloglines让人失望,谁也不会自找麻烦折腾来折腾去。

  花了不少时间对付OPML编码兼容问题,然后添加标签。总算搞完了,点进阅读列表一看,待读列表的第一篇居然就是keso的东拉西扯:放弃Bloglines,真神。

  估计要并用一段时间,把Bloglines作为Google被封后的备用。

搞生物的人

  下午去军事医学科学院考察他们的集群硬件环境。IBM的刀片服务器,16个节点,每个节点2个CPU,2G内存,还有几十T的磁盘。完成人类基因组计划后,他们开始参与人类蛋白质组计划,俺们算法的直接客户。

  无论Sequest还是Mascot,集群架构其实都差不多。

  国内生物实验室的高通量质谱仪越来越多,有的一天得出的实验结果数据就好几十G,所以就需要与此向适应的处理鉴定能力。和生物仪器比起来,集群硬件和鉴定软件的价格对生物学家不算最大的投资。

  生物信息学术会议上,一多半都是华人,我们与领域前沿的交流频繁程度并不逊色于任何人。开发自主的生物信息软件,科研实力并不是问题。在价格和服务反应上,相信本土开发者会更有优势。要说差距,也许就得在工程能力和科研成果孵化上考虑了。

Agile的JFox,Pragmatic的JFox

  昨天allen发了一篇BLOG:Agile J2EE、IoC、AOP : JFox的发展策略。明确提出JFox的新定位:Agile J2EE Application Server。也就是说,侧重于IoC,AOP技术,有选择性地支持EJB标准,放弃类似Entity Bean这样复杂而不实用的部分。

  很赞同这种明确实用的策略。提些小建议:

  1. 确 保固定的发布周期,短一些。最好每月一个milestone版,半年一个final版。人手不够?步子可以迈小一点;变化?把部分feature推迟到下 一版……无论如何,版本发布的频率节奏一定要稳定,周期要短。这是很多成功的开源项目的经验,也是Agile最重要的原则之一。
  2. 建立一个子项目,专门用于集成实用的示范应用,演示JFox推荐的体系结构、设计模式用法。这些示范应用必须是实际的完整的解决方案,而不是Hello World式的Demo。用户可以在此基础上修改扩充,形成自己的系统。Pragmatic的开发框架对推广很重要。

搜索引擎和非首页访问

  浏览访问日志是我的乐趣之一,有时控制不住,整天在那里病态地不断刷新,看过去10分钟有多少点击。做joyfire.net时甚至写了个小程序,每小时给我的email发统计报表。如果MSN Spaces推出报告站点流量的手机短信服务,估计我会忍不住去订。

  这个blog积累了一段时间,访问流量主要分为以下几种:

  1. 首页直接访问,由于MSN的特殊性,很大一部分都来自于MSN Messenger。
  2. 订阅RSS种子,这部分目前比重最大。
  3. 因为交换链接、发表评论或引用通告,反向链接过来的点击。
  4. 搜索引擎。

  前两种一般都访问最近更新的内容,第三种也有时效性,只有搜索引擎带来的流量比较稳定。分别看看5月份(因为考试没有怎么写BLOG)和去年11月(参加sohu的BLOG大赛)的访问日志,对比很明显。

  被频繁点击的是这几篇:

  关键字中,有关技术的很少。连2006年2月这篇关于MySQL的,搜索关键字也主要是“伍子婿”和“《孙子兵法》”这样的内容。

The young man knows the rules, but the old man knows the exceptions.

  法学家Oliver Wendell Holmes的名言。很多时候,逻辑无法替代经验。

  经理人总想找到一种通用的解释,一种可靠的信仰。翻翻书店里的管理书籍,几乎每本都提出一种万能“银弹”,摆出“麻烦到我这儿就结束了”的架势来。郁闷的是,到目前为止,这些方法的有效性和贝利对世界杯的预言差不多。

  这并不意味着理论就毫无可取之处。事实上无论是“战略规划”、“企业文化”、“执行”还是“蓝海战略”,都是由商业竞争中最出色的胜利者提出的概念。但这个领域远没达到完善,甚至还不能称为严格意义上的科学。单纯读再多经典,也变不成像作者一样出色的经理人。足球赛偶然性太多,贝利也说不清楚。

  要掌握管理,还是只有亲身实践一种途径而已。

Google黑板报上的离散数学

  从高中时代的香港那届全国计算机奥林匹克比赛算起,不断参加了不少与离散数学有关的考试。

  最近不打算写blog,准备在职硕士学位申请考试(还是有离散数学)。没想到在Google黑板报上看到离散数学的入门普及,登上来引用一下。

  本以为Google黑板报是面向有经验的软件开发者的PR,会讨论更高端的东西。比如挖keso过去;或者写写类似MapReduceGFSBigTable这样的技术;又或者组织个沙龙什么的。没想到内容是这样的。坦率说,似乎更适合面向高中生和本科低年级。

  不过这也许就是Google与众不同的地方。如果把开发软件比做武功,离散数学、组合数学、线形代数和数据结构这几样,就是《九阴真经》上册。上册内功呼吸没修行好,后面的拳脚身法容易走火入魔。

blog的spam过滤技术

  发现有站点利用blog的引用通告发布了大量垃圾广告,登上来删了好半天。

  这个爬虫先搜索每篇blog,寻找特定的关键字,然后根据关键字提交不同的引用通告。这种类似Google广告的方式比垃圾邮件的变化多一些。看来不久就会出现针对blog的spam过滤技术了。