Author Archives: wangleheng

论文和《周礼》

  恢复上班,晚上10点回家的地铁上,发现自己心情愉快。工作的充实感,把假期宅男的抑郁一扫而空。

  论文第9稿修改完成,马上就可以投了。现在看到英文就有晕车症状。接下来换换空气,开始折腾pFind 2.4产品方面的事,抓壮劳力双人编程,小弟们又要被俺周扒皮了。

  地铁上遇到几个mm议论中国传统文化,其中还有个金发碧眼的老外,学问不小。她告诉别人:《周礼》里的那一句“礼不下庶人,刑不上大夫”,先秦文字,“下”是排斥,“上”是优待。汉代以后,这句话才逐渐被有意无意地曲解了。

参加Open Party归来

  今天第一次参加Open Party的活动

  先说八卦。有对新婚夫妇,是去年11月在Open Party认识的,所以回来请大家吃喜糖。我没抢到,哇哇哭。

  这次由ThoughtWorks提供场所。俺的隐秘动机,是想刺探传说中的TW是什么样子:

  没有格子间,没有领导单间,除了会议室,全是开放的公共空间,很敞亮。墙上都是白板,贴满了User Story和CRC卡片,连临街的落地窗户也被用上了。游戏间放的是WII,零食还好……基本符合想象,不错不错。

  言归正传,听了如下几个技术报告:

  1. 詹建飞的《OPhone平台和程序开发》
  2. 刘华的《Mozilla架构平台》
  3. Cat Chen的《JavaScript异步编程模式》
  4. 段练的《GWT技术》
  5. 王家宽的《用wxPython开发理财软件》

  其中段练的《GWT技术》留下深刻印象,尤其是他开发的那个Web版化学分子结构编辑器让人叹服,回来查了查,原来专业是化学,业余爱好是编程;另外,Cat Chen的《JavaScript异步编程模式》功底很深,虽然只听了后半截仍然相当震撼;最近在乱看分布式存储方面的技术,成立涛的《Erlang与CouchDB》其实很感兴趣,可惜由于时间冲突,只听了几句。

  BTW:休假即将结束,要收心干正事了。

六度

  在TopLanguage上看到唐良的名字,就点进他的BLOG浏览。TL上的不少网名,其实此前就follow了很长时间。

  在BLOG里发现了对softboy和金点工作组的回忆,和我的这篇是前后脚发表的。

  才意识到,我们通过信。有次向金点工作组报告游戏源码BUG,是唐良回的email。

  这就是传说中的六度吗。

球迷

  不轻易在BLOG上写足球,可是这次实在有点郁闷。

  山东队又输了,北京队又一次比输还窝囊,上海队还在被老板玩,天津队还在闹内乱。他们在干什么?不像争冠军,倒像“谁敢比我惨”。我怎么有种被调戏的感觉。

  上半年,我和hchi哥经常一起看球,各为其主,别看hchi哥平时是个很nice的大好人,只要一说起自己的鲁能,就变成另一个可恨的、不积嘴德的家伙了。

  但是最近。过了比赛日,俺们见面都不好意思互相打招呼了。

  不过hchi哥还是比我忠诚。本周末山东到北京客场比赛,他老早就买好了票。

  我却决定不陪hchi一起去看了。一则国安队最近太给我添堵了,没动力为这帮人和hchi哥打嘴仗。二则,我很担心鲁能队一旦进球,hchi按耐不住激动的心情,一声好叫出来,被周围狂热的国安球迷认出来,那可就比美国步兵在阿富汗还危险了。到时候,俺若夹在中间,很惨很尴尬。

  快跟我一起给hchi哥发短信:冷静,冷静,那天最好穿绿色外套去工体,最起码,别穿橙色的。hchi平时帮过大伙多少忙呀,是吧,不能眼睁睁看他……

  其实,朱广沪那支拥有郑智、李玮峰、李雷雷、李毅、郑斌、迪亚戈的深圳队消失后,我就再也没有真正意义上的主队了。

Beta技术沙龙:利用SNMP进行服务监控

  昨天参加Beta技术沙龙霍炬银杏搜索利用SNMP作服务监控的系统实现

  架构很简洁清楚,容易理解。上层包装也有不少好玩的,例如直连GTalk,无论管理人员的物理位置在哪里,都能实时监控服务状态,进一步手机短信也不难了。

  报告摘要里,对需求的解释很到位:“运营大规模SAAS,对所有服务的状态进行管理和监控是难点之一……”。这正是我感兴趣的原因。日后pFind提供在线云计算服务,必然要考虑这方面的基础设施。其他听众包括,鲜果有道,还有做安全检测的,看来都是有目的而来。

  (顺便提一下,查了查我BLOG的订阅分布:Google Reader、鲜果、抓虾、豆瓣九点……Google Reader还是占压倒性优势)

  银杏主要针对十几种服务进行监控。我想,也许还能支持更细粒度的监控。例如在大规模集群环境中,监控每个节点上的计算进程,以保证MapReduce形式的大规模云计算服务的可靠性。会后交流时,我就此问了霍炬的想法,他没有明确的同意或反对。

  这是第一次见到霍炬真人版。果然是好工程师。逻辑清晰,思路活跃,解决方案明快有效,没有拖泥带水的废话和掩饰。

  会后又和tinyfoolnzinfo聊天(主要是他们说,俺听)。nzinfo第一次见,大侠居然在自己的iPhone上安装gcc和vi,更过分的是还装git版本管理。这么牛,怪不得有资格做tinyfool的竞争对手。nzinfo演示了几种iPhone上最著名的金融终端,包括布隆伯格(Bloomberg)的,各种分析工具还真挺全面。

  tinyfool刚发了一篇BLOG,谈谈对双人编程、单元测试、重构的理解,说得很到位,推荐。

  奇怪,这帮注重实战的工程师,全都开始踅摸起数学、折腾起matlab。难道是传说中的天下武学殊途同归。

推荐Resys Group

  误打误撞,发现牛人团伙。

  原本打算参加这期Beta技术沙龙,听霍炬讲的报告《大规模软件服务的管理和监控》。结果粗心大意,把时间记错了一天,今天下午就闯到奇遇花园咖啡馆去了。

  也幸亏记错了,才能遇到Resys的牛人们线下聚会,正在讲数据挖掘和推荐系统的算法(collaborative filtering),于是就买了饮料,蹭听了一场。

  讲演者是The Ensemble团队的中国成员,传说中的xlvector大侠。具体内容,当然是他们拿到Netflix Prize比赛leaderboard头名的比赛经验。

  下面开始八卦,给没听过Netflix Prize的火星人科普一下:

  美国DVD在线租赁商Netflix于2006年发起的竞赛,悬赏100万美元,只要提交比其现有Cinematch效果好10%的新算法,就获得巨款。Netflix公开了四十八万多用户对一万七千多部电影的上亿条评分记录,要求算法推测另外三百万条记录。同时,100万美元存入银行,每年5万利息作为年度进步奖,发给当年取得最好效果的参赛者。

  Netflix Prize产生了轰动效应。大概是因为,这让公众亲眼目睹,靠数学和编程是如何挣到真金白银的100万美元的。主流媒体,例如《纽约时报》对此给予了大量报道(2009年7月27日的报道是:Netflix Challenge Ends, but Winner Is in Doubt)。技术领域的超女选秀?你终于明白了。对Netflix来说,得到了性能超群的数据挖掘算法,还做了广告,名利双收。

  回来再说xlvector的讲座,八卦内幕相当精彩:一开始你追我赶;接着合纵连横,世界各地的独立的技术和参赛者逐渐融合,成为团队;最后,居然涉及复杂的商业谈判,大鱼吃小鱼,直到非此即彼,参与两个巨型阵营的团战……

  伴随比赛过程,发表了大量的高水平论文,也申请了不少的算法专利,还有不少好玩的讨论:

  比如有人研究了参加者的性别,发现一开始有很多女性参赛者,而且成绩很不错,但最后两个“超级大国”团队里没女性。研究结论是:女性不会投入两三年时间去做一件根本不可能成功的事;男性相对单细胞一些,杀红眼了就钻进去出不来了。

  参赛者Bill Bame在BLOG写到,他发现团队里都是两种人,一种是数学家,一种是工程师,思维方式行事风格截然不同,但两种人都发挥了至关重要的作用。

  The Ensemble团队最后30天工作中,租用了EC2云计算平台进行模型的训练与融合,每小时0.2$。MapReduce模式比较适合离线推荐算法。

  OK,八卦写完了。很久没遇到这么好玩的东西。推荐Resys Google Group。这篇BLOG中链接和引用,都是我回来刚搜索出来的,未必全面准确,大家继续挖掘吧。另外,明天的Beta技术沙龙,我也很期待,号召大家参加。

  最后赞一下奇遇花园咖啡馆。今天交流到最后,xlvector跑到墙边(整堵墙是一块巨大的黑板),用粉笔演算方程。一帮怪人在下面长吁短叹,其他客人头也不抬,继续喝咖啡上网。

照片来自wentrue的flickr

  BTW:只是咖啡馆附近的西直门地铁,实在让人恼火。感觉自己是实验小白鼠,在八卦阵里撞来撞去,难道就没有专业人士稍微做些优化吗。

休假状态,补列书单

  找不到人了?因为目前处于休息状态。

  这个夏天压力大,推迟了休假,别人回来了,我们几个才放。这两天的任务是让节奏慢下来,关手机、睡懒觉、不收邮件、甚至不吃饭。挑选听些相关不相关的报告。看书。看报纸杂志。

  补列一下七月到现在读完的书,BLOG欠账太多,罪过罪过:

  梁文道的《我执》,阿瑟·黑利《航空港》《晚间新闻》,雷纳·格鲁塞的《蒙古帝国史》,王立杰和许舟平的《敏捷无敌》,袁腾飞的《两宋风云》,Mark Schultz等的《The Stuff of Life: A Graphic Guide to Genetics and DNA》,张恨水的《金粉世家》,还有潘爱民的《程序员的自我修养》

                

  索性把7月去影院看过的电影也列上:《哈利波特6》《变形金刚2》《冰河时代3》,都是续集,不用动脑子。其实俺更想看的是《麦兜响当当》《飞屋环游记》,可惜没人一起。

    

学术交流和流星雨

  参加学术交流,会议场所湖光山色,环境很好。

  整天都是云里雾里的生物名词。今天听得最清楚的,是北大生命科学学院的院长饶毅教授的报告。而最乐的一段,要数:“咱们整天看好多‘很黄很暴力’的东西,而且不仅仅看哺乳动物的,还要看昆虫的。”

  晚上吃自助烧烤,接着卡拉OK大赛,hchi哥连续过了初赛和复赛,震撼全场,获得第二名。大伙儿又去玩了上百块钱的电子游戏。回到房间已过零点,正准备上床呼,突然收到wyj美女的短信:快出来看流星雨。

  一出门,就听到远远的整个山谷到处都是欢呼,还有很多女生的尖叫。

  长途跋涉,翻山越岭,从窗户跳到天台上,一边嘟囔:“我都三十岁的大叔了,还跟着你们几个小孩子折腾,我容易吗我。”结果:“少废话,把浴巾和毯子拿过来。”

  别说,仰面朝天躺着,漫天星斗、明亮的下玄月、远远的银河,真挺漂亮。

  他们说,赶紧许愿,于是我开始念叨:“pFind能卖1个亿”、“pFind能卖2个亿”……到6个亿的时候,一颗流星唰地过去。

  我问wyj,“你觉得hchi哥获得诺贝尔奖帅,还是图灵奖帅?”,答曰:“图灵奖更帅”,我说:“那俺就祝他得诺贝尔奖吧”。话音没落,一颗特别明亮的火流星,划出粗粗的红色轨迹,从我们头顶冲过去。大伙一起对着hchi哥:“哇!”

  BTW 1:带来的梁文道的《我执》已经看了一半;雷纳·格鲁塞的《蒙古帝国史》读完第二章,成吉思汗统一蒙古高原。(之前一个月太纠结,连新买的书单都没列,回北京后补上)。

  BTW 2:论文第6稿,修订到吐。hchi哥帮我批改得很仔细,还指出了几个致命问题,看来还得大动干戈。什么事吐啊吐就习惯了,上一篇期刊我改了30稿,这还早呢。

pFind Studio 2.3 RC

  7月焦头烂额。居然连BLOG都耽误了。这很不好,写BLOG并不妨碍工作,然而对成长的记录却是一种不可缺少的自我投资,坚持得越久,回报越多。实际上,这个月发生了不少好玩的大事小情,当时不立刻记下来,很快就失去鲜活感了。

  突然有敲字的兴致,赶紧登录上来。有些内容先做索引,后面的blog陆续详述。内容散乱,理解精神吧:)

  pFind Studio 2.3发布了Release Candidate。以往,每个新软件或模块的主力作者有权利给作品命名一个昵称,组里惯例是动画片或科幻角色。例如:pFind 2.1内核,hchi哥命名为Doraemon,也就是机器猫的名字;组里两台服务器,hp命名,一个叫shark,《海底总动员》里的鲨鱼;一个叫donkey,《怪物史莱克》里的驴子;所向披靡的pLabel 2.0之父lyxiu,把它命名为Wall.E,《机器人总动员》里的主角。

  yjw mm给pFind 2.3内核起名为EVA,《机器人总动员》里帅帅的侦查机器人,这是组内产品序列的昵称里,首次出现女性名字。08年8月8日,hchi哥的Doraemon发布时,俺就感叹:完美,没想到不到1年,又被拍死在沙滩上了。

  (BTW:前两天30岁生日,怨念和纠结,请组里去钱柜唱K,收到惊喜礼物:一个EVA。你和她说话,她就表演电影里的台词、动作和眼神,一模一样。放在书房里,夜里上网,她就在那里“Wal…l…E”,“E…VA”地不停折腾)

  czh哥给新版索引模块命名为Simba,狮子王里面的主角。

  (BTW:利用pFind新索引的恐怖功能,rxsun大虾做了件很酷的事:对恐龙化石里的胶原蛋白,进行跨物种搜索。结果证明,鸟类的蛋白序列的确和恐龙最接近)

  瓶子哥给pFind并行版内核起名为Monsters,《怪物电力公司》里的主人公。这个月也就是为了它的论文纠结,英文写到吐。下半年还要申请一个发明专利。

  (BTW:在同一个大型集群上跑相同的鉴定任务,SEQUEST折腾了24小时,Monsters仅仅花费2800秒,鉴定准确性上也占压倒优势。牵着俺们的怪兽出去,真的吓坏了不少人)

  业界大事嘛,其实不太关心Google宣布要推出PC的操作系统。我感兴趣的新闻有:C++标准委员会居然否决了concepts;Apple发布新版iPhone SDK;Google发布simple编程语言;久其软件获准IPO,创造100位百万富翁(里面有大量北交大计算机系和通控系的校友,不少是我的好朋友,哈)。

老妈的电话

  下午接到老妈电话,她又说没事。于是回了一句“我在开会呢”,急急忙忙挂掉。

  偏偏晚上和瓶子哥修改技术报告有点反复拖延,10点出来,地铁都没有了,打车回家。进门,渴,吃西瓜,开空调,洗脸……过了好久,才发现老妈不对头。

  原来老太太下午在外头逛街,不留神狠狠摔了一跤,门牙都摔掉了。

  当时一定很疼,所以给我打电话,又怕我操心,只说没事,就是问我啥时候回家。

  明天请假陪老妈去医院检查,老太太还一个劲不愿意,说自己去就行,怕耽误我工作。

  少罗嗦,我已经决定了

  末了,老妈偷偷叹了一口气:“老了”。

  什么呀,总是习惯走路带风,速度快得别人追不上,又粗心大意不仔细看路,而且眼镜片花了舍不得配副新的,摊上哪个年轻人,都得摔个嘴啃泥。明天陪你顺便把眼镜也配好了。

  同志们,我们长大了,也就是说,到了父母需要更多关心的时代了。再接电话时,别像某个混蛋儿子今天那样,粗心大意急火火。如果父母在外地,拨过去问问平安吧。“这点事儿都做不到,养这么大的一个儿子有什么用,煮着吃吗?”