断网断电话一段时间，还有pFind的千核并行进展

　　从明天开始，我在一段时间内无法上网，也无法接听电话。

　　顺便说说pFind Studio进展。最近hf和xs在全力完善pBuild 2.0。稍后我们会向全球用户群发邮件，邀请大家试用最新版本。另外，于上个月在深腾7000超级计算机上刚完成的实验中，pFind千核并行取得了满意的加速比。瓶子哥正在拼搏（站好最后一班岗），在2048核处理器规模下试验更大规模的数据。

　　俺们算初步解决了多修饰海量谱图的高效并行加速问题。用户可以选定15种之多的修饰，或者把母离子误差开到500Da之大，pFind百核集群都能在常规时间内完成搜索鉴定。而现有的公开报道中，世界上其他竞争对手超过32核加速效率就会变差。大言不惭地说，俺们在并行加速方面获得领先。

　　但仅考虑海量谱图是不够的，如果面对超常的巨型蛋白质序列库（例如直接搜索人类基因组数据，或这两年很热的用恐龙化石中提取的蛋白质搜索全生物库的需求），主流搜素引擎目前还都无法做到有效并行。仔细分析可知，这种情况下搜索引擎的运算特点就从以计算密集型为主，转为计算密集型和I/O密集型兼有，接近Web搜索引擎。也就是说，Google MapReduce那一套有用武之地了。

joyfire 王乐珩地雷

有事多Google，没事少上网

断网断电话一段时间，还有pFind的千核并行进展

2 thoughts on “断网断电话一段时间，还有pFind的千核并行进展”

Leave a Reply Cancel reply