Category Archives: 流水帐

拷贝粘贴中

  最终没用任何程序和服务,选择手工逐篇拷贝。顺手修订错字,修复失效链接。spaces莫名其妙被墙,幸亏备份了。还没来得及整理blogroll,原有友情链接很多还是spaces的,需要整理更新。朋友们主动联系互相告知吧。

  一开始没意识到工作量这么大,比较头痛的是WordPress发布功能可能有bug,修改Permalink经常失败(另外一个可能是虚拟主机服务不稳定)。此前共发表了七百多篇BLOG,目前wangleheng.net这里只整理好一百篇。

  考虑到不可控因素,例如服务器稳定性,被墙风险等,所以推荐利用Google Reader等阅读器订阅。订阅新的wangleheng.net种子无法搜索到很多以前的内容。稍后我会整理2005年以来全部BLOG的标题和链接列表以便查找。

  刚看完了《三体III死神永生》和《1Q84 book3》。

新博客,新年快乐

  IP地址经过6、7次更换后正常了。插件和代码也鼓捣差不多了。重温过去四、五年的文字,感受到自己的变化。

  每到一月都会定几个年度目标。如果有事和这些目标冲突,就克制自己,放弃诱惑,确保重点。事实证明,对我这种单线程生物来说,集中精力是最好的生存方式。

  2010年目标实现得比较完满:pFind引擎在千核下取得满意加速效率,申请了专利和软件著作权,发表了英文paper;私人方面,结婚了,买车了。感谢大家。

  送妻子一份古怪的新年礼物(用Google Chart API实现的)。

joyfire的博客从spaces live搬到这里

  计划从http://joyfire.spaces.live.com搬家过来,这一篇是测试。

  前一段忙于CNCP2010pFind Studio 2.6的发布,没顾上BLOG。因为整理5年的文字、安装配置、修复软件漏洞等事务需要一些时间,烦请等待。目前这个IP,似乎在国内有些运营商处被墙。请朋友们提醒我,必要时更换其他主机。

  感谢您的支持,我会继续写下去。

去上海参加“软件开发2.0大会”

  马上要去上海。先参加12月9日的“软件开发2.0大会,然后去合作伙伴那里升级和调试pFind并行版。自从08年底最后一次去上海,时间飞快就过去了。很喜欢上海这座城市,一想到小杨生煎包就掉口水。期待与上海的朋友们聊天。

  一年的工作即将收尾。等我再回到北京,pFind Studio 2.6就会正式发布。敬请期待。

  我是08年初去上海时戏剧性地陷入低潮的。此后一路挣扎。今年开心地完成了几件大事(这个这个这个这个),终于从大坑里爬出来了。这次再去上海,也算是故事首尾呼应吧。BOSS H今天开会评价我“最近三年工作风格上变保守了”。的确是谨慎了,这与工作具体需要和个人的心境都有点关系。等pFind Studio 2.6发布了,明年放松下来,着手更多探索性工作,尝试弄出些吓人的东西来。

计算蛋白质组学研讨会和大S结婚

  下周一,CNCP2010的会前培训就要开始了。pFind Studio的测试和改进一直在高强度进行,10月份Bug管理系统里Fixed的Bug创造了历史纪录;11月虽然刚过一周,修正和改进的条目的数量已经相当可观,看来这个月再创新高没悬念。除了准备软件,还负责CNCP2010的官方邮件,从确认住宿、介绍交通到提醒南方参会者加衣保暖,上千封邮件。

  一方面,不收注册费,拒绝商业赞助;另外一方面,筹备工作细致到了偏执(例如检查会场所有电源和插线板的插口,备份三台投影仪和三台笔记本)。外人大多难以理解。

  的确辛苦,昨晚22:00回家,疲惫不堪,地铁上人又多,突然有股砸破玻璃跳出车窗外的冲动。熬到家门口,还没掏钥匙门就开了,老婆接过笔记本,老妈打开羊肉火锅的电源,开水滚出香味儿,暖烘烘的。

  最近技术上的心得都没精力分享。说点工作外的:大S要出嫁。今天在最新一期《经济观察报》第54版看到一篇《某公子》很好玩。财经写手果然比娱乐版的层次高,写八卦都更好看些。文笔出色,叙事吸人,只是结论实在有些冷酷。用张爱玲笔下葛薇龙做比,有些狠。

流水帐.2010.10.4

  还没有确定是不是WordPress.com。办妥了会通告。先补前一段时间落下的内容。好久没写BLOG,不好意思。

  9月份工作很紧张,终于把软件著作权、专利和商标的申请都搞定了。pFind并行版内容最终拆分为三个互相掩护的子专利,因为涉及到MapReduce技术,还特意和专利代理律师一起研究了有关资料,除了论文,还包括今年1月份刚刚公开的7650331号专利。这期间还注意到一条新闻:Google最新版引擎Caffeine已经放弃MapReduce架构。接下来补更多实验,要啃一个超过五百万张谱图的庞大数据集。偏偏碰到深腾7000停机修整,踅摸中……

  最近不仅没精力写BLOG,也没空买书。前两天才抽出空来去了一趟中关村图书大厦,买到了爱德华·吉本的《罗马帝国衰亡史》、沈群的《美国也荒唐》、W.Bruce等的《搜索引擎》(也就是Search Engines: Information Retrieval in Practice的中文版)、周汝昌的《红楼小讲》、林语堂的《平心论高鹗》

零零碎碎

  没有整块的语言好BLOG,就用”韩峰体”分享点零零碎碎吧。(其实是想测一下,出现这三个字是不是真会被GFW)。

  1. zixia的微博又活了,他开始新创业。从12年前在aka上听他的Linux培训开始,俺始终是他的粉丝; 
     

      ……我于07年创立的微博服务 JiWai.com 的“被死亡”,让我度过了一段非常难忘的时光……均衡了各方面因素,最终将叽歪网所有资产转让……;

     

  2. 孟岩BLOG发了一篇对所谓“职业生涯规划”的议论: 
     

      ……如果你听说伯南克要采取“非常规的货币政策”,还没吓得魂飞魄散,那你的存在本身是个悲剧……

     

  3. 刘慈欣刚刚宣布《三体》的第三部《死神永生》写完了; 
     

      ……社会动荡是科幻最大的杀手。现在,平静已经延续了二十多年,感觉到在社会基层,有什么东西正在绷紧,压跨骆驼的最后一根稻草随时都可能出现。但愿这只是一个科幻迷的忋人忧天……

     

  4. 饶毅和施一公在最新一期Science上发表社论:China’s Research Culture,抨击国内科研经费分配的潜规则。 
     

      ……这个问题在浪费经费资源、腐蚀学术精神、阻碍科研创新……

     

  5. 韩国一个团队,把GPU应用到路由器领域,软件路由器(跑在通用PC上)的速度创了记录;

马尔代夫

  我在Google Map上找到了这次渡假的两个小岛KurumbaVelassaru

断网断电话一段时间,还有pFind的千核并行进展

  从明天开始,我在一段时间内无法上网,也无法接听电话。

  顺便说说pFind Studio进展。最近hf和xs在全力完善pBuild 2.0。稍后我们会向全球用户群发邮件,邀请大家试用最新版本。另外,于上个月在深腾7000超级计算机上刚完成的实验中,pFind千核并行取得了满意的加速比。瓶子哥正在拼搏(站好最后一班岗),在2048核处理器规模下试验更大规模的数据。

  俺们算初步解决了多修饰海量谱图的高效并行加速问题。用户可以选定15种之多的修饰,或者把母离子误差开到500Da之大,pFind百核集群都能在常规时间内完成搜索鉴定。而现有的公开报道中,世界上其他竞争对手超过32核加速效率就会变差。大言不惭地说,俺们在并行加速方面获得领先。

  但仅考虑海量谱图是不够的,如果面对超常的巨型蛋白质序列库(例如直接搜索人类基因组数据,或这两年很热的用恐龙化石中提取的蛋白质搜索全生物库的需求),主流搜素引擎目前还都无法做到有效并行。仔细分析可知,这种情况下搜索引擎的运算特点就从以计算密集型为主,转为计算密集型和I/O密集型兼有,接近Web搜索引擎。也就是说,Google MapReduce那一套有用武之地了。

我在kanrss上的帐号是@joyfire

  我在KanRSS上的帐号是@joyfire。这是老张stdyun.com之后的新进展。作为教主的忠实粉丝,俺自然要追随。站点还在开发中(代码开源在Google Code),目前里面注册的还只是刘未鹏云风Fennglimodou郑昀刘江阿北Tinyfool一众人等。

  昨天端午节,某人带着她的17双高跟鞋归顺于我,自此天下大定。

  准备出发。不过印度洋又地震了,俺却不会游泳,订的还是水上屋……纠结啊。