Tag Archives: 23andMe

23andMe被黑了

  23andMe遭黑客攻击,700万用户DNA数据泄露,包括马斯克、扎克伯格等众多名人的信息。马斯克的基因父系类型是东亚高频的O2(O2b1-F1150)。这就和马斯克太爷是私生子的家族历史印证。他的祖源与目前江苏宜兴宗氏、浙江宁波殷氏有共同父系祖先。

  其实很多事实很残酷,比如美国黑人的DNA数据,99%都是欧洲父系。我本来不想举中国的例子,山东孔家接近中亚/高加索人的父系基因哪里来的?而且不止一次基因突变,一次在南北朝,一次在元朝。这其实不只是种族问题,还是阶级问题。此前看过一篇社会遗传学的论文,通过对比族谱和基因,300年前的中国男性95%已经绝后。只有地主阶级的父系基因才能遗传至今。

Google为何进军生化领域?也许是因为老板要离婚。

  TIME报道:Google投资成立了一家名叫Calico的生物技术公司。Apple董事长Arthur Levinson也参与投资而且担任CEO。Arthur Levinson自己是生化专业的博士,也是Genentech的董事长。没透露太多细节,但是新公司的愿景听起来口气很大。

  从2005年起就一直在猜测,Google什么时候会大规模进军生化领域。最近的一次消息是DNAnexus在2011年获得Google Ventures投资。Google还将利用自身的IAAS对DNAnexus提供技术支持。因为预算吃紧美国政府关闭了NCBI,所以DNAnexus的DNA数据云服务有望成为生化科研的公共数据基础。

  Google为什么对生化领域有浓厚兴趣?Google两个创始人Sergey Brin和Larry Page都娶了生物信息专业美女。Larry Page患有罕见的神经系统疾病,阻碍声带的动作,无法在公众场合演讲。另外Larry Page还患有桥本氏甲状腺炎。而Sergey Brin的妻子Anne Wojcicki创立了著名的基因技术公司23andMe(也被Google投资)。前些年Sergey Brin尝试23andMe的DNA测序服务,发现自己患上帕金森症的概率很高。

  八卦一点:最近Sergey Brin在闹离婚(新闻炒得很热,原安卓系统的负责人Hugo Barra被Sergey Brin抢走了女友,怒而投奔雷军的小米),Anne Wojcicki和Sergey Brin已经分居。所以我猜,23andMe指望不上了,那就索性自己投资一家。

  至于国内互联网,腾讯研究院2010年发表过一篇学术论文:How to build a DNA search engine like Google? 还申请了与此相关的专利。2011年公开了实验性的DNA搜索引擎。阿里云和华大基因也有试验性的业务合作。倒是百度没听过这一类消息。

  八卦写完了,稍微说点严肃的。上月美国高等法院裁定基因是“自然造物”,属于不能申请专利之范畴。然而,法院同时认定,cDNA作为细胞基因的人工复制品,可以申请专利。诉讼中的一方是Myriad Genetics公司,分别在1994和1995年为两个乳腺癌突变基因BRCA1/2申请了专利。现在BRCA1/2本身不再受限,但cDNA专利会让其他竞争对手的研究过程异常艰难。

  关于生物信息创业,以前还写过一些业务需求技术特点

Google投资基因组数据服务

  这两天生化和生物信息领域的人很兴奋,因为Google对DNAnexus的投资。

  DNAnexus刚刚在A轮融资中获得1500万美元投资,投资方包括Google Ventures。除了资金,Google还将利用自身基础设施,如Google Cloud Storage,对DNAnexus提供技术支持。美国政府因为预算吃紧即将关闭NCBI,所以DNAnexus的DNA数据云服务今后有望成为生物科研的基础。

  回顾一下:

  十年前人类基因组计划完成,多国科学家利用了几亿美元,花费数年才完成了一个人的DNA测序;

  六年前,中国第一个商用案例,某位匿名亿万富翁花了一千万RMB给自己测序;

  四年前,Google联合创始人之一在自己妻子创立的23andMe公司内接受基因测序,被预测出帕金森症高危,因此大笔捐助研究这种疾病的基金会,此时23andMe已推出了免费测序服务(当然你要接受自己的DNA隐私被出售,以及随之而来的各种医疗服务的恐惧营销);

  而到了今年夏天,在55BBS孕宝亲子版上,北京的孕妇们开始热烈讨论购买华大基因的DNA测序服务以进行唐氏儿筛查。1500元的推广价当然还高于成本,但按照目前基因测序技术的发展速度(大大超过了摩尔定律),其成本很快就会降到普通人可以接受的范围,成为普通医院的标配。

每个基因组(人)的测序成本 - 来自NHGRI

  随着测序技术的进步,如何对接近10T的基因深度测序原始数据进行分析就成了问题。总不能让每个病人都拿着10T的硬盘到医院的集群上现算吧。云服务是合乎逻辑的方式。所以生物信息领域的人,等待Google等互联网巨头的进入,已经有好几年了。

  一直在期待领域Killer Application的出现,也一直在讨论“云计算+生物”的技术细节,让暴风雨来得更猛烈些吧。

杀手级应用在哪里?

  今天被这篇癌症诊断的论文吸引,看了一晚上。

  做科研的,尤其是一直在象牙塔里打转,为研究而研究的领域,最希望有朝一日能大量投入日常实用。以前提过,生物信息学如何摆脱阳春白雪呢,也得有靠近老百姓的应用。

  目前踅摸出来的比较热的点子,大概都是类似通过个人的基因来算祖先、算性格、算儿女的模式,比如刚刚获得Google投资的这家23andMe。这种娱乐性质的算命应用制造了不少科技八卦新闻,比如美国一个大学教授弄清了自己是成吉思汗的直系后代,身上的基因最早聚集于外高加索,又在几百年前移民英国,最终飘洋过海传播到新大陆;再比如中国学者拿来考古,搞清辽国后裔现位于云南,汉朝与匈奴战争中的“罗马军团”是阿富汗雇佣兵;非洲奇特的黄种人部落来源于郑和宝船上某些风流的水手;再好事一点的,跑去研究日本某反华政治家的老底,据说他的基因多半源于六百年前南宋灭亡时东渡的中国难民……

  这当然不够,要像IT一样成为决定性产业,就得在国计民生重大问题上帮上大忙。开头提到的论文,综述质谱技术在癌症临床诊断的应用前景。这项实际应用虽然还在“婴儿期”,但分量很重,又被大家看好,“原来这就是传说中的给你三颗痔,让你变成孙悟空的那个人”。就像论文中提到的,现有癌症诊断手段假阳性和假阴性相当高。我就有不止一个朋友曾验出癌症,吓得半死,再去复查,原来不是。这是假阳性,还好,也就是浪费钱浪费感情而已,假阴性就麻烦了,错过治疗癌症的最佳时期,到了晚期只好束手无策。