Category Archives: 流水帐

joyfire的博客从spaces live搬到这里

  计划从http://joyfire.spaces.live.com搬家过来,这一篇是测试。

  前一段忙于CNCP2010pFind Studio 2.6的发布,没顾上BLOG。因为整理5年的文字、安装配置、修复软件漏洞等事务需要一些时间,烦请等待。目前这个IP,似乎在国内有些运营商处被墙。请朋友们提醒我,必要时更换其他主机。

  感谢您的支持,我会继续写下去。

去上海参加“软件开发2.0大会”

  马上要去上海。先参加12月9日的“软件开发2.0大会,然后去合作伙伴那里升级和调试pFind并行版。自从08年底最后一次去上海,时间飞快就过去了。很喜欢上海这座城市,一想到小杨生煎包就掉口水。期待与上海的朋友们聊天。

  一年的工作即将收尾。等我再回到北京,pFind Studio 2.6就会正式发布。敬请期待。

  我是08年初去上海时戏剧性地陷入低潮的。此后一路挣扎。今年开心地完成了几件大事(这个这个这个这个),终于从大坑里爬出来了。这次再去上海,也算是故事首尾呼应吧。BOSS H今天开会评价我“最近三年工作风格上变保守了”。的确是谨慎了,这与工作具体需要和个人的心境都有点关系。等pFind Studio 2.6发布了,明年放松下来,着手更多探索性工作,尝试弄出些吓人的东西来。

计算蛋白质组学研讨会和大S结婚

  下周一,CNCP2010的会前培训就要开始了。pFind Studio的测试和改进一直在高强度进行,10月份Bug管理系统里Fixed的Bug创造了历史纪录;11月虽然刚过一周,修正和改进的条目的数量已经相当可观,看来这个月再创新高没悬念。除了准备软件,还负责CNCP2010的官方邮件,从确认住宿、介绍交通到提醒南方参会者加衣保暖,上千封邮件。

  一方面,不收注册费,拒绝商业赞助;另外一方面,筹备工作细致到了偏执(例如检查会场所有电源和插线板的插口,备份三台投影仪和三台笔记本)。外人大多难以理解。

  的确辛苦,昨晚22:00回家,疲惫不堪,地铁上人又多,突然有股砸破玻璃跳出车窗外的冲动。熬到家门口,还没掏钥匙门就开了,老婆接过笔记本,老妈打开羊肉火锅的电源,开水滚出香味儿,暖烘烘的。

  最近技术上的心得都没精力分享。说点工作外的:大S要出嫁。今天在最新一期《经济观察报》第54版看到一篇《某公子》很好玩。财经写手果然比娱乐版的层次高,写八卦都更好看些。文笔出色,叙事吸人,只是结论实在有些冷酷。用张爱玲笔下葛薇龙做比,有些狠。

流水帐.2010.10.4

  还没有确定是不是WordPress.com。办妥了会通告。先补前一段时间落下的内容。好久没写BLOG,不好意思。

  9月份工作很紧张,终于把软件著作权、专利和商标的申请都搞定了。pFind并行版内容最终拆分为三个互相掩护的子专利,因为涉及到MapReduce技术,还特意和专利代理律师一起研究了有关资料,除了论文,还包括今年1月份刚刚公开的7650331号专利。这期间还注意到一条新闻:Google最新版引擎Caffeine已经放弃MapReduce架构。接下来补更多实验,要啃一个超过五百万张谱图的庞大数据集。偏偏碰到深腾7000停机修整,踅摸中……

  最近不仅没精力写BLOG,也没空买书。前两天才抽出空来去了一趟中关村图书大厦,买到了爱德华·吉本的《罗马帝国衰亡史》、沈群的《美国也荒唐》、W.Bruce等的《搜索引擎》(也就是Search Engines: Information Retrieval in Practice的中文版)、周汝昌的《红楼小讲》、林语堂的《平心论高鹗》

零零碎碎

  没有整块的语言好BLOG,就用”韩峰体”分享点零零碎碎吧。(其实是想测一下,出现这三个字是不是真会被GFW)。

  1. zixia的微博又活了,他开始新创业。从12年前在aka上听他的Linux培训开始,俺始终是他的粉丝; 
     

      ……我于07年创立的微博服务 JiWai.com 的“被死亡”,让我度过了一段非常难忘的时光……均衡了各方面因素,最终将叽歪网所有资产转让……;

     

  2. 孟岩BLOG发了一篇对所谓“职业生涯规划”的议论: 
     

      ……如果你听说伯南克要采取“非常规的货币政策”,还没吓得魂飞魄散,那你的存在本身是个悲剧……

     

  3. 刘慈欣刚刚宣布《三体》的第三部《死神永生》写完了; 
     

      ……社会动荡是科幻最大的杀手。现在,平静已经延续了二十多年,感觉到在社会基层,有什么东西正在绷紧,压跨骆驼的最后一根稻草随时都可能出现。但愿这只是一个科幻迷的忋人忧天……

     

  4. 饶毅和施一公在最新一期Science上发表社论:China’s Research Culture,抨击国内科研经费分配的潜规则。 
     

      ……这个问题在浪费经费资源、腐蚀学术精神、阻碍科研创新……

     

  5. 韩国一个团队,把GPU应用到路由器领域,软件路由器(跑在通用PC上)的速度创了记录;

马尔代夫

  我在Google Map上找到了这次渡假的两个小岛KurumbaVelassaru

断网断电话一段时间,还有pFind的千核并行进展

  从明天开始,我在一段时间内无法上网,也无法接听电话。

  顺便说说pFind Studio进展。最近hf和xs在全力完善pBuild 2.0。稍后我们会向全球用户群发邮件,邀请大家试用最新版本。另外,于上个月在深腾7000超级计算机上刚完成的实验中,pFind千核并行取得了满意的加速比。瓶子哥正在拼搏(站好最后一班岗),在2048核处理器规模下试验更大规模的数据。

  俺们算初步解决了多修饰海量谱图的高效并行加速问题。用户可以选定15种之多的修饰,或者把母离子误差开到500Da之大,pFind百核集群都能在常规时间内完成搜索鉴定。而现有的公开报道中,世界上其他竞争对手超过32核加速效率就会变差。大言不惭地说,俺们在并行加速方面获得领先。

  但仅考虑海量谱图是不够的,如果面对超常的巨型蛋白质序列库(例如直接搜索人类基因组数据,或这两年很热的用恐龙化石中提取的蛋白质搜索全生物库的需求),主流搜素引擎目前还都无法做到有效并行。仔细分析可知,这种情况下搜索引擎的运算特点就从以计算密集型为主,转为计算密集型和I/O密集型兼有,接近Web搜索引擎。也就是说,Google MapReduce那一套有用武之地了。

我在kanrss上的帐号是@joyfire

  我在KanRSS上的帐号是@joyfire。这是老张stdyun.com之后的新进展。作为教主的忠实粉丝,俺自然要追随。站点还在开发中(代码开源在Google Code),目前里面注册的还只是刘未鹏云风Fennglimodou郑昀刘江阿北Tinyfool一众人等。

  昨天端午节,某人带着她的17双高跟鞋归顺于我,自此天下大定。

  准备出发。不过印度洋又地震了,俺却不会游泳,订的还是水上屋……纠结啊。

我结婚了

  BLOG是一种广播式媒体,最好发表对别人有意义的独立内容。一般情况下,我更喜欢在BLOG角落里用春秋笔法藏些私人生活方面的蛛丝马迹。不过结婚这件事,还是别玩弯弯绕,向朋友们公开交代比较好。

  2月17日在摇晃的地铁车厢里求婚的时候,还有挑选婚戒规划婚事的时候,俺就知道5月份会过得很艰难。得全力以赴赶上工作生活中的各种deadline。昨天领完结婚证,还以为纠结的5月终于可以画上一个比较圆满的句号了,结果……今天一早出门去丈母娘家,事情还没完呢。

  幸运的是,俺能找到zhw这样一个合适的爱人。根据英国人的科研论文,概率是二十八万五千分之一

  我们计划下月去马尔代夫蜜月旅行。

  感谢每个帮助、宽容我的亲友。特别感谢Queen美女在胜负未分时提供的关键火力支援,她帮我挑选的香水礼物是名副其实的杀手锏。