BigTable和生物信息

  以前提到过,GFS分布并行、高度容错、海量I/O、“重”插入查询“轻”删除、面向廉价PC集群的特点,很适合生物信息方面的应用

  最近构建在GFS基础上的BigTable受到关注。简单地说,BigTable提供稀疏表形式的数据存取服务,除了拥有GFS的原有特点,更适合存放半结构化的数据。所谓半结构化数据,和关系数据 库的表一样是二维的,有字段(列)和记录(行)的概念,但每个字段不限制长度,适于存储HTML和RSS(XML)。而生物信息应用中,肽、质谱、酶、修 饰等都是由一组或多组不定长字符串表达的半结构化数据。

  Google进军生物信息领域,看似隔行,其实门槛很低,因为原有核心竞争力在此领域同样有效。

Leave a Reply

Your email address will not be published.

This site uses Akismet to reduce spam. Learn how your comment data is processed.