Monthly Archives: August 2009

参加Open Party归来

  今天第一次参加Open Party的活动

  先说八卦。有对新婚夫妇,是去年11月在Open Party认识的,所以回来请大家吃喜糖。我没抢到,哇哇哭。

  这次由ThoughtWorks提供场所。俺的隐秘动机,是想刺探传说中的TW是什么样子:

  没有格子间,没有领导单间,除了会议室,全是开放的公共空间,很敞亮。墙上都是白板,贴满了User Story和CRC卡片,连临街的落地窗户也被用上了。游戏间放的是WII,零食还好……基本符合想象,不错不错。

  言归正传,听了如下几个技术报告:

  1. 詹建飞的《OPhone平台和程序开发》
  2. 刘华的《Mozilla架构平台》
  3. Cat Chen的《JavaScript异步编程模式》
  4. 段练的《GWT技术》
  5. 王家宽的《用wxPython开发理财软件》

  其中段练的《GWT技术》留下深刻印象,尤其是他开发的那个Web版化学分子结构编辑器让人叹服,回来查了查,原来专业是化学,业余爱好是编程;另外,Cat Chen的《JavaScript异步编程模式》功底很深,虽然只听了后半截仍然相当震撼;最近在乱看分布式存储方面的技术,成立涛的《Erlang与CouchDB》其实很感兴趣,可惜由于时间冲突,只听了几句。

  BTW:休假即将结束,要收心干正事了。

六度

  在TopLanguage上看到唐良的名字,就点进他的BLOG浏览。TL上的不少网名,其实此前就follow了很长时间。

  在BLOG里发现了对softboy和金点工作组的回忆,和我的这篇是前后脚发表的。

  才意识到,我们通过信。有次向金点工作组报告游戏源码BUG,是唐良回的email。

  这就是传说中的六度吗。

球迷

  不轻易在BLOG上写足球,可是这次实在有点郁闷。

  山东队又输了,北京队又一次比输还窝囊,上海队还在被老板玩,天津队还在闹内乱。他们在干什么?不像争冠军,倒像“谁敢比我惨”。我怎么有种被调戏的感觉。

  上半年,我和hchi哥经常一起看球,各为其主,别看hchi哥平时是个很nice的大好人,只要一说起自己的鲁能,就变成另一个可恨的、不积嘴德的家伙了。

  但是最近。过了比赛日,俺们见面都不好意思互相打招呼了。

  不过hchi哥还是比我忠诚。本周末山东到北京客场比赛,他老早就买好了票。

  我却决定不陪hchi一起去看了。一则国安队最近太给我添堵了,没动力为这帮人和hchi哥打嘴仗。二则,我很担心鲁能队一旦进球,hchi按耐不住激动的心情,一声好叫出来,被周围狂热的国安球迷认出来,那可就比美国步兵在阿富汗还危险了。到时候,俺若夹在中间,很惨很尴尬。

  快跟我一起给hchi哥发短信:冷静,冷静,那天最好穿绿色外套去工体,最起码,别穿橙色的。hchi平时帮过大伙多少忙呀,是吧,不能眼睁睁看他……

  其实,朱广沪那支拥有郑智、李玮峰、李雷雷、李毅、郑斌、迪亚戈的深圳队消失后,我就再也没有真正意义上的主队了。

Beta技术沙龙:利用SNMP进行服务监控

  昨天参加Beta技术沙龙霍炬银杏搜索利用SNMP作服务监控的系统实现

  架构很简洁清楚,容易理解。上层包装也有不少好玩的,例如直连GTalk,无论管理人员的物理位置在哪里,都能实时监控服务状态,进一步手机短信也不难了。

  报告摘要里,对需求的解释很到位:“运营大规模SAAS,对所有服务的状态进行管理和监控是难点之一……”。这正是我感兴趣的原因。日后pFind提供在线云计算服务,必然要考虑这方面的基础设施。其他听众包括,鲜果有道,还有做安全检测的,看来都是有目的而来。

  (顺便提一下,查了查我BLOG的订阅分布:Google Reader、鲜果、抓虾、豆瓣九点……Google Reader还是占压倒性优势)

  银杏主要针对十几种服务进行监控。我想,也许还能支持更细粒度的监控。例如在大规模集群环境中,监控每个节点上的计算进程,以保证MapReduce形式的大规模云计算服务的可靠性。会后交流时,我就此问了霍炬的想法,他没有明确的同意或反对。

  这是第一次见到霍炬真人版。果然是好工程师。逻辑清晰,思路活跃,解决方案明快有效,没有拖泥带水的废话和掩饰。

  会后又和tinyfoolnzinfo聊天(主要是他们说,俺听)。nzinfo第一次见,大侠居然在自己的iPhone上安装gcc和vi,更过分的是还装git版本管理。这么牛,怪不得有资格做tinyfool的竞争对手。nzinfo演示了几种iPhone上最著名的金融终端,包括布隆伯格(Bloomberg)的,各种分析工具还真挺全面。

  tinyfool刚发了一篇BLOG,谈谈对双人编程、单元测试、重构的理解,说得很到位,推荐。

  奇怪,这帮注重实战的工程师,全都开始踅摸起数学、折腾起matlab。难道是传说中的天下武学殊途同归。

推荐Resys Group

  误打误撞,发现牛人团伙。

  原本打算参加这期Beta技术沙龙,听霍炬讲的报告《大规模软件服务的管理和监控》。结果粗心大意,把时间记错了一天,今天下午就闯到奇遇花园咖啡馆去了。

  也幸亏记错了,才能遇到Resys的牛人们线下聚会,正在讲数据挖掘和推荐系统的算法(collaborative filtering),于是就买了饮料,蹭听了一场。

  讲演者是The Ensemble团队的中国成员,传说中的xlvector大侠。具体内容,当然是他们拿到Netflix Prize比赛leaderboard头名的比赛经验。

  下面开始八卦,给没听过Netflix Prize的火星人科普一下:

  美国DVD在线租赁商Netflix于2006年发起的竞赛,悬赏100万美元,只要提交比其现有Cinematch效果好10%的新算法,就获得巨款。Netflix公开了四十八万多用户对一万七千多部电影的上亿条评分记录,要求算法推测另外三百万条记录。同时,100万美元存入银行,每年5万利息作为年度进步奖,发给当年取得最好效果的参赛者。

  Netflix Prize产生了轰动效应。大概是因为,这让公众亲眼目睹,靠数学和编程是如何挣到真金白银的100万美元的。主流媒体,例如《纽约时报》对此给予了大量报道(2009年7月27日的报道是:Netflix Challenge Ends, but Winner Is in Doubt)。技术领域的超女选秀?你终于明白了。对Netflix来说,得到了性能超群的数据挖掘算法,还做了广告,名利双收。

  回来再说xlvector的讲座,八卦内幕相当精彩:一开始你追我赶;接着合纵连横,世界各地的独立的技术和参赛者逐渐融合,成为团队;最后,居然涉及复杂的商业谈判,大鱼吃小鱼,直到非此即彼,参与两个巨型阵营的团战……

  伴随比赛过程,发表了大量的高水平论文,也申请了不少的算法专利,还有不少好玩的讨论:

  比如有人研究了参加者的性别,发现一开始有很多女性参赛者,而且成绩很不错,但最后两个“超级大国”团队里没女性。研究结论是:女性不会投入两三年时间去做一件根本不可能成功的事;男性相对单细胞一些,杀红眼了就钻进去出不来了。

  参赛者Bill Bame在BLOG写到,他发现团队里都是两种人,一种是数学家,一种是工程师,思维方式行事风格截然不同,但两种人都发挥了至关重要的作用。

  The Ensemble团队最后30天工作中,租用了EC2云计算平台进行模型的训练与融合,每小时0.2$。MapReduce模式比较适合离线推荐算法。

  OK,八卦写完了。很久没遇到这么好玩的东西。推荐Resys Google Group。这篇BLOG中链接和引用,都是我回来刚搜索出来的,未必全面准确,大家继续挖掘吧。另外,明天的Beta技术沙龙,我也很期待,号召大家参加。

  最后赞一下奇遇花园咖啡馆。今天交流到最后,xlvector跑到墙边(整堵墙是一块巨大的黑板),用粉笔演算方程。一帮怪人在下面长吁短叹,其他客人头也不抬,继续喝咖啡上网。

照片来自wentrue的flickr

  BTW:只是咖啡馆附近的西直门地铁,实在让人恼火。感觉自己是实验小白鼠,在八卦阵里撞来撞去,难道就没有专业人士稍微做些优化吗。

休假状态,补列书单

  找不到人了?因为目前处于休息状态。

  这个夏天压力大,推迟了休假,别人回来了,我们几个才放。这两天的任务是让节奏慢下来,关手机、睡懒觉、不收邮件、甚至不吃饭。挑选听些相关不相关的报告。看书。看报纸杂志。

  补列一下七月到现在读完的书,BLOG欠账太多,罪过罪过:

  梁文道的《我执》,阿瑟·黑利《航空港》《晚间新闻》,雷纳·格鲁塞的《蒙古帝国史》,王立杰和许舟平的《敏捷无敌》,袁腾飞的《两宋风云》,Mark Schultz等的《The Stuff of Life: A Graphic Guide to Genetics and DNA》,张恨水的《金粉世家》,还有潘爱民的《程序员的自我修养》

                

  索性把7月去影院看过的电影也列上:《哈利波特6》《变形金刚2》《冰河时代3》,都是续集,不用动脑子。其实俺更想看的是《麦兜响当当》《飞屋环游记》,可惜没人一起。

    

学术交流和流星雨

  参加学术交流,会议场所湖光山色,环境很好。

  整天都是云里雾里的生物名词。今天听得最清楚的,是北大生命科学学院的院长饶毅教授的报告。而最乐的一段,要数:“咱们整天看好多‘很黄很暴力’的东西,而且不仅仅看哺乳动物的,还要看昆虫的。”

  晚上吃自助烧烤,接着卡拉OK大赛,hchi哥连续过了初赛和复赛,震撼全场,获得第二名。大伙儿又去玩了上百块钱的电子游戏。回到房间已过零点,正准备上床呼,突然收到wyj美女的短信:快出来看流星雨。

  一出门,就听到远远的整个山谷到处都是欢呼,还有很多女生的尖叫。

  长途跋涉,翻山越岭,从窗户跳到天台上,一边嘟囔:“我都三十岁的大叔了,还跟着你们几个小孩子折腾,我容易吗我。”结果:“少废话,把浴巾和毯子拿过来。”

  别说,仰面朝天躺着,漫天星斗、明亮的下玄月、远远的银河,真挺漂亮。

  他们说,赶紧许愿,于是我开始念叨:“pFind能卖1个亿”、“pFind能卖2个亿”……到6个亿的时候,一颗流星唰地过去。

  我问wyj,“你觉得hchi哥获得诺贝尔奖帅,还是图灵奖帅?”,答曰:“图灵奖更帅”,我说:“那俺就祝他得诺贝尔奖吧”。话音没落,一颗特别明亮的火流星,划出粗粗的红色轨迹,从我们头顶冲过去。大伙一起对着hchi哥:“哇!”

  BTW 1:带来的梁文道的《我执》已经看了一半;雷纳·格鲁塞的《蒙古帝国史》读完第二章,成吉思汗统一蒙古高原。(之前一个月太纠结,连新买的书单都没列,回北京后补上)。

  BTW 2:论文第6稿,修订到吐。hchi哥帮我批改得很仔细,还指出了几个致命问题,看来还得大动干戈。什么事吐啊吐就习惯了,上一篇期刊我改了30稿,这还早呢。