Category Archives: 流水帐

推荐10月份的《程序员》

  刚刚收到10月份的《程序员》,有几篇文章不错,推荐一下。

  这期组织了一个产品开发、营销和运营的专题。第一篇就是周鸿祎的《用互联网的思想经营产品》,很赞同其中的很多观点。之前谢文有一篇文字,对开发、营销和运营三阶段有很类似的论述。分析Windows Vista这款失败产品那一段,和Joel on software的看法基本一致。

  最近数据挖掘和推荐的话题很火爆,大牛们纷纷加入Resys Group。《程序员》保持了嗅觉灵敏、迅速跟进的特点,这一期里有《商品推荐背后的数学》和《Tag和Tagging》两篇与此有关。

  感兴趣的一篇小文章是《编程习惯》,强调了版本控制、构建系统、自动化测试、代码评阅、重构、代码风格等六大基础设施。刚好和俺前两天写的不谋而合。

  HR的内容越来越多了,例如《建立完整的外包人才体系》、《绩效考核的五种死因》、《绩效实施经验六法》等。今天和朋友吃饭,聊天说起这个来,很多HR部门都有故弄玄虚的坏毛病,交流困难,演进缓慢。在这种不良气氛下,个人的职业成长很多时候更需要依赖悟性和韧劲。

流水2009.10.4

  • pFind并行调度论文投稿了,最后是第17版。30页英文改了这么多遍,最后时刻仍不断收到试读人的大量意见,说明作者逻辑和英语有多弱。(谢谢大家!)特感谢瓶子哥的韧劲,10月1日还在修,直到临晨2点。接下来着手申请专利。
  • 被人提醒追求完美要有限度。不过人家又赞了一句:执着的人,够酷。明年,在千核集群上继续研发,让世界上其他竞争对手团队望尘莫及。老大说:“你是火鸡的时候,别的鸡不会承认你个头大,只有变成鸵鸟,才能让它们彻底服气。”
  • 双节,老娘的60大寿。陪她看《建国大业》。老一代不数星星,更关注历史本身,一闪而过的边缘人物她都清楚来龙去脉。不过,老太太还是知道些八卦的:“那个声嘶力竭喊‘毛委员’的,娶了个法国老婆,叫刘烨”。
  • 有幸和我老娘同一天生日,缜密平衡的天枰座的家伙,生日快乐。
  • 上周有一天,房间进了三只蚊子。半夜爬起来,用了一个半小时逐一消灭掉。在等待蚊子“嗡嗡”声出现的间歇,读完了《卡萨诺瓦是个书痴》
  • 在用Google Music听《私房音乐(费洛蒙)》,开始用它的原因,是别的在线音乐服务对Firefox支持都不太好。

中国万网有安全问题

  keso在讨论中国万网被阿里巴巴收购。刚好,我这两天正为万网怒火中烧。

  无论私人域名还是单位用的pFind域名,一直使用万网的域名服务。虽然贵一点,但感觉服务还好,品牌比较可信。

  昨天发现有域名被指向了121.199.253.187,再Google了一下,发现这个IP地址是一个诈骗网站,被网通电信列入屏蔽黑名单。在线提交了技术支持单,又打电话过去。服务人员态度倒还好,很快改回来,但没解释原因。今天域名被再次指向121.199.253.187。恼火,国庆敏感时期,域名莫名其妙指向诈骗网站,如果被管理机构封掉,说都说不清楚。

  这说明万网有安全问题。作为国内最大的域名服务商,这种表现让人失望。

999新人、哲学家就餐和lehuo域名

  稍息,讲一下。

  昨天是999,据说北京领证上岗的人数突破了历史纪录,甚至超过了去年的888。飞飞给我们发喜糖,原来他也当了传说中的三九新人。

  给八卦一族爆点猛料:别看飞飞是这么内敛稳重的人,该出手时就出手,爆发力惊人。人家通过网络认识美女飞嫂,一见钟情,一拍即合,快刀斩乱麻,效率超过曙光大机上的pFind搜索引擎,一点不含糊。

  不贫了。恭喜恭喜。羡慕中。

  借机澄清谣言。居然有人说我们组里有断背痕迹,因为吃饭时那几个人老是凑在一起,汗。

  组里有好几个左撇子,在大餐桌一起吃饭时,邻座之间胳膊总是互相较劲,搞得像哲学家就餐问题。嫌烦,大家把左撇子扔到一堆去。慢慢的就养成固定的座次习惯了。

  BTW:请想买lehuo域名的看这篇帖子

列书单.2009.9.6

  今天上午与zw约会看电影,下午独自去逛书店。觉得和她相处很开心,追!

  两周没逛书店了。今天去了一趟五道口的光合作用,买到了米兰·昆德拉的《生活在别处》、麦克·莫波格的《柑橘与柠檬啊》和汉密尔顿的《卡萨诺瓦是个书痴》

      

  周围N多人推荐《飞屋环游记》,终于去看了。不知怎么搞得,竟然被一部动画片的开头15分钟弄得满眼眶都是泪水,差点流出来,晕。感觉开头的这15分钟,很像那部奥斯卡最佳动画短片。另外,发现这部片子并不是整部全是3D的,而是3D和2D段落相互间隔。是为了调节观众的眼睛疲劳,还是制作成本问题,或是因为现场出现技术故障?

  唐僧:下雨,北京凉起来了。注意加衣服。

论文和《周礼》

  恢复上班,晚上10点回家的地铁上,发现自己心情愉快。工作的充实感,把假期宅男的抑郁一扫而空。

  论文第9稿修改完成,马上就可以投了。现在看到英文就有晕车症状。接下来换换空气,开始折腾pFind 2.4产品方面的事,抓壮劳力双人编程,小弟们又要被俺周扒皮了。

  地铁上遇到几个mm议论中国传统文化,其中还有个金发碧眼的老外,学问不小。她告诉别人:《周礼》里的那一句“礼不下庶人,刑不上大夫”,先秦文字,“下”是排斥,“上”是优待。汉代以后,这句话才逐渐被有意无意地曲解了。

参加Open Party归来

  今天第一次参加Open Party的活动

  先说八卦。有对新婚夫妇,是去年11月在Open Party认识的,所以回来请大家吃喜糖。我没抢到,哇哇哭。

  这次由ThoughtWorks提供场所。俺的隐秘动机,是想刺探传说中的TW是什么样子:

  没有格子间,没有领导单间,除了会议室,全是开放的公共空间,很敞亮。墙上都是白板,贴满了User Story和CRC卡片,连临街的落地窗户也被用上了。游戏间放的是WII,零食还好……基本符合想象,不错不错。

  言归正传,听了如下几个技术报告:

  1. 詹建飞的《OPhone平台和程序开发》
  2. 刘华的《Mozilla架构平台》
  3. Cat Chen的《JavaScript异步编程模式》
  4. 段练的《GWT技术》
  5. 王家宽的《用wxPython开发理财软件》

  其中段练的《GWT技术》留下深刻印象,尤其是他开发的那个Web版化学分子结构编辑器让人叹服,回来查了查,原来专业是化学,业余爱好是编程;另外,Cat Chen的《JavaScript异步编程模式》功底很深,虽然只听了后半截仍然相当震撼;最近在乱看分布式存储方面的技术,成立涛的《Erlang与CouchDB》其实很感兴趣,可惜由于时间冲突,只听了几句。

  BTW:休假即将结束,要收心干正事了。

六度

  在TopLanguage上看到唐良的名字,就点进他的BLOG浏览。TL上的不少网名,其实此前就follow了很长时间。

  在BLOG里发现了对softboy和金点工作组的回忆,和我的这篇是前后脚发表的。

  才意识到,我们通过信。有次向金点工作组报告游戏源码BUG,是唐良回的email。

  这就是传说中的六度吗。

球迷

  不轻易在BLOG上写足球,可是这次实在有点郁闷。

  山东队又输了,北京队又一次比输还窝囊,上海队还在被老板玩,天津队还在闹内乱。他们在干什么?不像争冠军,倒像“谁敢比我惨”。我怎么有种被调戏的感觉。

  上半年,我和hchi哥经常一起看球,各为其主,别看hchi哥平时是个很nice的大好人,只要一说起自己的鲁能,就变成另一个可恨的、不积嘴德的家伙了。

  但是最近。过了比赛日,俺们见面都不好意思互相打招呼了。

  不过hchi哥还是比我忠诚。本周末山东到北京客场比赛,他老早就买好了票。

  我却决定不陪hchi一起去看了。一则国安队最近太给我添堵了,没动力为这帮人和hchi哥打嘴仗。二则,我很担心鲁能队一旦进球,hchi按耐不住激动的心情,一声好叫出来,被周围狂热的国安球迷认出来,那可就比美国步兵在阿富汗还危险了。到时候,俺若夹在中间,很惨很尴尬。

  快跟我一起给hchi哥发短信:冷静,冷静,那天最好穿绿色外套去工体,最起码,别穿橙色的。hchi平时帮过大伙多少忙呀,是吧,不能眼睁睁看他……

  其实,朱广沪那支拥有郑智、李玮峰、李雷雷、李毅、郑斌、迪亚戈的深圳队消失后,我就再也没有真正意义上的主队了。

推荐Resys Group

  误打误撞,发现牛人团伙。

  原本打算参加这期Beta技术沙龙,听霍炬讲的报告《大规模软件服务的管理和监控》。结果粗心大意,把时间记错了一天,今天下午就闯到奇遇花园咖啡馆去了。

  也幸亏记错了,才能遇到Resys的牛人们线下聚会,正在讲数据挖掘和推荐系统的算法(collaborative filtering),于是就买了饮料,蹭听了一场。

  讲演者是The Ensemble团队的中国成员,传说中的xlvector大侠。具体内容,当然是他们拿到Netflix Prize比赛leaderboard头名的比赛经验。

  下面开始八卦,给没听过Netflix Prize的火星人科普一下:

  美国DVD在线租赁商Netflix于2006年发起的竞赛,悬赏100万美元,只要提交比其现有Cinematch效果好10%的新算法,就获得巨款。Netflix公开了四十八万多用户对一万七千多部电影的上亿条评分记录,要求算法推测另外三百万条记录。同时,100万美元存入银行,每年5万利息作为年度进步奖,发给当年取得最好效果的参赛者。

  Netflix Prize产生了轰动效应。大概是因为,这让公众亲眼目睹,靠数学和编程是如何挣到真金白银的100万美元的。主流媒体,例如《纽约时报》对此给予了大量报道(2009年7月27日的报道是:Netflix Challenge Ends, but Winner Is in Doubt)。技术领域的超女选秀?你终于明白了。对Netflix来说,得到了性能超群的数据挖掘算法,还做了广告,名利双收。

  回来再说xlvector的讲座,八卦内幕相当精彩:一开始你追我赶;接着合纵连横,世界各地的独立的技术和参赛者逐渐融合,成为团队;最后,居然涉及复杂的商业谈判,大鱼吃小鱼,直到非此即彼,参与两个巨型阵营的团战……

  伴随比赛过程,发表了大量的高水平论文,也申请了不少的算法专利,还有不少好玩的讨论:

  比如有人研究了参加者的性别,发现一开始有很多女性参赛者,而且成绩很不错,但最后两个“超级大国”团队里没女性。研究结论是:女性不会投入两三年时间去做一件根本不可能成功的事;男性相对单细胞一些,杀红眼了就钻进去出不来了。

  参赛者Bill Bame在BLOG写到,他发现团队里都是两种人,一种是数学家,一种是工程师,思维方式行事风格截然不同,但两种人都发挥了至关重要的作用。

  The Ensemble团队最后30天工作中,租用了EC2云计算平台进行模型的训练与融合,每小时0.2$。MapReduce模式比较适合离线推荐算法。

  OK,八卦写完了。很久没遇到这么好玩的东西。推荐Resys Google Group。这篇BLOG中链接和引用,都是我回来刚搜索出来的,未必全面准确,大家继续挖掘吧。另外,明天的Beta技术沙龙,我也很期待,号召大家参加。

  最后赞一下奇遇花园咖啡馆。今天交流到最后,xlvector跑到墙边(整堵墙是一块巨大的黑板),用粉笔演算方程。一帮怪人在下面长吁短叹,其他客人头也不抬,继续喝咖啡上网。

照片来自wentrue的flickr

  BTW:只是咖啡馆附近的西直门地铁,实在让人恼火。感觉自己是实验小白鼠,在八卦阵里撞来撞去,难道就没有专业人士稍微做些优化吗。