Tag Archives: DNAnexus

GeneDock研发团队的一些方法论

  逼着自己上来写BLOG。最近工作强度非常大,回到家吃完饭洗完碗,真的手指尖都不想动一下。不过工作有进展,人有成长,心情还不错。今天冒着大雨回家,浑身湿透,但是心里一动:“两年前的今天我心情很糟,现在虽然累得像条狗,却很充实,看来这次创业是对了。”

  创业以来,感觉还算顺利。所谓好运气,部分源于GeneDock团队有一套自洽的逻辑。创业和投资说到底拼的是世界观,你对现实世界的某个局部有独特的洞见。这里面有些关于技术产品,有些关于团队管理,有些关于商务销售。

  这篇BLOG再总结一下GeneDock研发的方法论。算是呼应一年前的那篇《思考:如何开发应用平台》,对其做一些补充或再次强调。

一、彻底信仰API

  Alex Iskold说:“API代表公司的业务本质……思考API实际上就是思考公司的未来……”

  绝对赞同,一年多前我在社交网络发过一条对国内一些所谓基因云的吐槽:“不是做个Web页面就有资格叫云计算的。前端若不提供RESTful API、编程语言SDK以及UNIX风格的CLI工具包,后端若没有可拓展的分布式架构、防单点故障的failover机制……就别觍着脸自称云计算了,这只是一个网站而已”。这话似乎刺痛了某些人。

  GeneDock刚刚对外开放了第一批Workflow和Task有关的11个API。欢迎大家试用,这里是API-Reference文档。如果单从Web Service的设计这一点看,我们的产品领先于国内外友商。

二、To B 的产品逻辑:别抖机灵

  To B 产品和 To C 产品有很多业务差异。To B 是给专家甚至专家团队用的软件,本质上在卖你对行业的独特洞见,在卖你的工作哲学。例如,当年SAP的ERP软件最成功,因为他们最理解德国制造的业务逻辑;再如,Salesforce在卖的是销售团队的方法论;而GitHub实际在卖他们对软件工程的理解:Bug管理、版本管理、Code Review……

  另一方面,To B 和To C 其实都是给人用的软件。从设计和研发的方法论来看,并没什么本质区别。GeneDock产品经理何荣惠(在阿里云的时候程序员们昵称“神仙姐姐”)在知乎回答过“to B 的产品经理和 to C 的产品经理有什么差别?”,我觉得写得很好。

  总之。To B 产品,抖机灵没用,保持克制和敬畏。躬身入局,琢磨清楚基因数据传输、存储、分析、应用的所有业务场景。

  我们刚刚上线的企业账号功能,对很多团队都有用。GeneDock官方BLOG对此有描述,推荐大家看一下。

三、坚守软件工程底线

  GeneDock只雇用最好的程序员。好程序员必须能熟练应用软件工程的成功方法论。

  至于什么是好的软件工程,一年前都写过了:“好的软件工程实践,决定了技术团队的层次。Github用的怎么样、Bug管理怎么样、代码审核是否严格、发布升级是否自动化、有没有单元和集成测试……到一个技术团队里呆几个小时,鼻子闻一闻,就知道几斤几两。技术团队如果这些基本功不好,摩擦力会越来越大。”

  不只是提高自己内部生产率,GeneDock还想把数据生产的最佳实践推广到整个行业,成为生物信息行业的GitHub。我们正在优化配置和调试的体验,总结GeneDock生信团队的流程规范。后面会不断放出软件工程培训文档和配套工具,让生物信息程序员们效率更高,更专业,工作更有价值。

Google为何进军生化领域?也许是因为老板要离婚。

  TIME报道:Google投资成立了一家名叫Calico的生物技术公司。Apple董事长Arthur Levinson也参与投资而且担任CEO。Arthur Levinson自己是生化专业的博士,也是Genentech的董事长。没透露太多细节,但是新公司的愿景听起来口气很大。

  从2005年起就一直在猜测,Google什么时候会大规模进军生化领域。最近的一次消息是DNAnexus在2011年获得Google Ventures投资。Google还将利用自身的IAAS对DNAnexus提供技术支持。因为预算吃紧美国政府关闭了NCBI,所以DNAnexus的DNA数据云服务有望成为生化科研的公共数据基础。

  Google为什么对生化领域有浓厚兴趣?Google两个创始人Sergey Brin和Larry Page都娶了生物信息专业美女。Larry Page患有罕见的神经系统疾病,阻碍声带的动作,无法在公众场合演讲。另外Larry Page还患有桥本氏甲状腺炎。而Sergey Brin的妻子Anne Wojcicki创立了著名的基因技术公司23andMe(也被Google投资)。前些年Sergey Brin尝试23andMe的DNA测序服务,发现自己患上帕金森症的概率很高。

  八卦一点:最近Sergey Brin在闹离婚(新闻炒得很热,原安卓系统的负责人Hugo Barra被Sergey Brin抢走了女友,怒而投奔雷军的小米),Anne Wojcicki和Sergey Brin已经分居。所以我猜,23andMe指望不上了,那就索性自己投资一家。

  至于国内互联网,腾讯研究院2010年发表过一篇学术论文:How to build a DNA search engine like Google? 还申请了与此相关的专利。2011年公开了实验性的DNA搜索引擎。阿里云和华大基因也有试验性的业务合作。倒是百度没听过这一类消息。

  八卦写完了,稍微说点严肃的。上月美国高等法院裁定基因是“自然造物”,属于不能申请专利之范畴。然而,法院同时认定,cDNA作为细胞基因的人工复制品,可以申请专利。诉讼中的一方是Myriad Genetics公司,分别在1994和1995年为两个乳腺癌突变基因BRCA1/2申请了专利。现在BRCA1/2本身不再受限,但cDNA专利会让其他竞争对手的研究过程异常艰难。

  关于生物信息创业,以前还写过一些业务需求技术特点

Google投资基因组数据服务

  这两天生化和生物信息领域的人很兴奋,因为Google对DNAnexus的投资。

  DNAnexus刚刚在A轮融资中获得1500万美元投资,投资方包括Google Ventures。除了资金,Google还将利用自身基础设施,如Google Cloud Storage,对DNAnexus提供技术支持。美国政府因为预算吃紧即将关闭NCBI,所以DNAnexus的DNA数据云服务今后有望成为生物科研的基础。

  回顾一下:

  十年前人类基因组计划完成,多国科学家利用了几亿美元,花费数年才完成了一个人的DNA测序;

  六年前,中国第一个商用案例,某位匿名亿万富翁花了一千万RMB给自己测序;

  四年前,Google联合创始人之一在自己妻子创立的23andMe公司内接受基因测序,被预测出帕金森症高危,因此大笔捐助研究这种疾病的基金会,此时23andMe已推出了免费测序服务(当然你要接受自己的DNA隐私被出售,以及随之而来的各种医疗服务的恐惧营销);

  而到了今年夏天,在55BBS孕宝亲子版上,北京的孕妇们开始热烈讨论购买华大基因的DNA测序服务以进行唐氏儿筛查。1500元的推广价当然还高于成本,但按照目前基因测序技术的发展速度(大大超过了摩尔定律),其成本很快就会降到普通人可以接受的范围,成为普通医院的标配。

每个基因组(人)的测序成本 - 来自NHGRI

  随着测序技术的进步,如何对接近10T的基因深度测序原始数据进行分析就成了问题。总不能让每个病人都拿着10T的硬盘到医院的集群上现算吧。云服务是合乎逻辑的方式。所以生物信息领域的人,等待Google等互联网巨头的进入,已经有好几年了。

  一直在期待领域Killer Application的出现,也一直在讨论“云计算+生物”的技术细节,让暴风雨来得更猛烈些吧。