Tag Archives: 质数的孤独

平台需要生态系统

  ODPS Sprint8发布了。算法平台也随之发布了很多新功能。

  最近8个工作周累计只有1/4时间呆在北京,剩下的时间都在杭州。几乎每周都是周二飞到杭州,周末再飞回来。以至于偶尔在北京办公室露面,旁边同学们都问我:“这次到北京出差打算呆几天?”

  例外是上个月底。每次Sprint发布之前都有这么一个阶段:从Word、Excell、Outlook里,从飞机场和会议室里逃出来。静下心,ssh连上跳板机,svn checkout,vi……写代码、加UT、提review、加班熬夜,重新变成一个程序员。这往往是整个产品周期里,比较平静的一周。

  不过这次Sprint8我出错了,在逻辑回归的命令行指令里写出两个Bug来。不得不在发布后的几天里陷入煎熬,紧急打补丁。前天晚上HotFix折腾到23点。我离开办公室时,数据科学家团队还在继续加班。第二天3个基于我们算法的大数据模型按时上线。出自淘宝的工程团队,执行力很强悍。

  作为平台,拥有生态环境是至关重要的:你有没有冲进客户业务里去,理解并搞定关键问题?反过来,别人能否沉到平台里面来,贡献代码和数据?有多大的器量就有多大的空间。找到靠谱的业务伙伴,应该在旁边摇着扇子、八抬大轿伺候着。

  之前yy在客户现场呆了半年之久,帮客户重构了很多关键业务,获得了“数仓专家”的职业声誉。我去杭州,老大给我的指令是,像yy一样,扎进BI团队,成为合格的”数据科学家”。这事不容易,不过不会比杀小白鼠更难。

  工作上好久没这么发狠了。

  飞机上看完了《质数的孤独》。作者是个粒子物理学博士,处女作就获得斯特雷加奖。这本小说的页码不是连续的,而是质数序列:2,3,5,7……所有文艺作品都涉及孤独,因为孤独很普遍,这一部写得尤其彻底。

列书单.2012.10.20

  数据魔方和淘宝指数刚结束双系统并跑,把生产环境迁到ODPS上。顺便提一下,淘宝指数显示最近与莫言有关的搜索量暴涨。

淘宝指数

  11月的sprint对我很重要。工作有点紧张,没闲余写博客。上来把最近买的新书列一下,再积累下去就懒得编辑了。

  最近买了黄仁宇的《资本主义与二十一世纪》、Phil Rosenzweig的《光环效应》、Daniel Kahneman的《思考,快与慢》、Paolo Giordano的《质数的孤独》、 Charles Stross的《奇点天空》、Robert Charles Wilson的《时间回旋》《斯蒂芬·金的故事贩卖机》、米兰 · 昆德拉的《玩笑》、Michael Lewis的《点球成金》、Anand Rajaraman / Jeffrey David Ullman的《大数据——互联网大规模数据挖掘与分布式处理》、Matthew A. Russell的《社交网站的数据挖掘与分析》、许式伟的《Go语言编程》和Subbu Allamaraju的《RESTful Web Services Cookbook中文版》