列书单.2008.10.5

  从上海回来之前,买到了村上春树《海边的卡夫卡》在火车上看。今天在中关村图书大厦买到了觊觎已久的《代码之美》

  

  《代码之美》文笔相当精彩。

  比如Google的架构师Jeffrey Dean和Sanjay Ghemawai的那篇,我很喜欢上来就单刀直入的写法:

  假设你有200亿个文档,想要统计出每个单词在所有文档中出现的总次数。假设每个文档的平均大小是20KB,那么一台机器读完400TB的数据需要四个月左右。假设我们愿意等待的时间足够长,机器内存足够大,那么相关实现代码十分简单,如下……

  Arun Mehta的那篇《当你与世界的联系只有一个按钮时》的开头,也同样吸引人:

  “Stephen Hawking(斯蒂芬·霍金)教授只能按一个按钮”,在给我们的需求说明书中,只有这句话。

  Hawking教授是杰出的理论物理学家,但他不幸患有ALS……只能通过Equalizer用一个按钮来写字和说话,Equalizer使用了一台外置的盒子进行从文本到发音的转换,现在这种盒子已停产,Equalizer的源代码也丢失了。

  为了在老化的硬件发生故障的时候,还能与外界保持交流,他联系了一些软件公司,希望能编写某种软件,使那些有着高度运动神经残疾的人能通过这种软件访问电脑。我们很高兴地接受了这个挑战。我们把产品称作eLocutor,并决定让它开源,这样Equalizer的历史就不会重演了……

  八卦38个作者的个人资料。除了两篇bioinformatics主题文章的作者以外,Travis E.Oliphant(NumPy多维迭代器)和Andrew Patzer(REST方式集成Web服务)也从事生物信息领域的工作。

Leave a Reply

Your email address will not be published. Required fields are marked *