连续加班。筋疲力竭,死扛,晚上总做噩梦惊醒。今天全天开会,16人次讲PPT。晚上聚餐,算是告一段落了。
前天应邀去Intel公司测试pFind并行版。是国贸旁边的那个实验室,就在央视新楼对面。公司的落地窗正是看焰火的好地方。ch博说,09年元月十五,他就在办公室。
pFind表现正常。因为时间所限,测试参数不能设置得过“重”。以前提过,随着并行规模的扩大,pFind集群开始出现I/O密集型应用的特点。下一步的千核集群,Master节点应改成异步模式,很多步骤要用MapReduce。
从08年底开始做pFind并行计算,逐渐加深理解。现在看来,要兼顾“减少流程冗余”,“均衡负载”和“提高I/O效率”三个要素,才能获得好性能。其实,明确这三个问题,比解决它们更重要。如果RCM论文搞定了,就在BLOG里写写我们的解决方案。
这次跟着高手学到不少。比如以前不知道用make -j参数,每次编译ACE,都得用三四十分钟。再如这次ch博推荐的paratera.com工具,对分析集群实时状态很有用。
下一版的pFind内核还没规划,但是已经开始琢磨“昵称”了。按照我们的惯例,需要是科幻或动画角色。我强烈要求用Leonopteryx,《阿凡达》中的红色大鸟。
Pingback: joyfire 王乐珩 » 2010年BLOG列表