Category Archives: 创业时代

2020杭州里程碑

  到杭州创业,就过上了没日没夜的战斗生活。这两天病了,有空上BLOG记录一下。

  5月,确定了产品的roadmap。

  发了下面这张照片,是范库弗峰造船厂在批量建造航空母舰。1942年,他们从罗斯福总统手里拿到建造50艘航母的订单。用了一年多就全部下水完成。美国鼎盛时期的工业制造和项目管理能力真是惊人。

  7月,第一个里程碑到达。这时候我在大量面试。开心,估计明年开始就有00后来面试找工作了。是00后会替我报仇。我终于可以和团队里的90后说,你们也老了。国内经济恢复的势头好猛。别人不说,我们这个小创业公司在疯狂加班,天天愁招人。

  8月6日,又一个里程碑到达。事情开始上轨道。日拱一卒,功不唐捐。给自己点个赞。

  读历史的时候发现,东晋时期天师教盛行。天师教的logo类似“之”字,因此大量教徒名字里加“之”,例如:王羲之、王献之、王凝之、陈庆之、陈牢之、顾恺之、祖冲之、裴松之等。

  下面这张照片,是那时候加完班半夜在公司院子里拍的。

  

  9月,连续2个里程碑。呼兰段子里说,产品经理和程序员的关系,就像唐僧和孙悟空。想想还真贴切。不过我这种写过十年C++,用来赚过钱的编程语言17种的唐僧,更让孙悟空恨的牙痒。27日里程碑发布那天,发了一条冯唐的诗:“尚未佩妥剑,转眼便江湖。愿历尽千帆,归来仍少年。”

  10月,开始疲惫,开始出状况,放松对团队的压力。保护节奏感。

  读历史,楚国这个国家很有个性,很好玩。比如这个:三十五年,楚伐随。随曰:“我无罪。”楚曰:“我蛮夷也。”楚国祖先血统高贵,是祝融后裔,是周文王的火师,也就是大祭司。只是被周王室黑了,发配到边疆,还被降级到周边蛮夷级别。所以他们总有怨气,说话很冲。史书上全是这种中二表达。包括最后的一句:“楚虽三户,亡秦必楚。”

地雷赌了两件事

“凤衔金榜出云来,平地一声雷。”

18年数据老将地雷(花名),2020年5月加入奇点云,任技术总监。

5月11日,他在博客里写道:这一次在赌两件事

“至暗时刻”

今年年初,那正是国内疫情最严重的时候,地雷做了一个大胆的决定:离开AI独角兽企业,去一家服务泛零售行业的创业公司。

彼时,许多线下零售企业无法开张,经营受到重挫,其数字化转型预算大幅削减,服务它们的创业公司必然受到影响。不少人劝他不要“想不开”。在众多劝他的人里,甚至包括认识多年的老友行在。

作为奇点云的创始人兼CEO,行在非常希望地雷加入,但作为朋友,他又忍不住多劝几句:“你现在有一笔股票,公司还即将上市,前途无量。而我们仍在战斗,现在还是‘至暗时刻’。”

“老张当时特别严肃。我和老张认识八年了,他一直是这样的人,非常坦诚。”地雷说,选择一家公司,要看这家公司做的“事”,更要看他们的“人”。

“其实创业这么多年,我也经历过至暗时刻,我知道扛过这段时期就能变得很好。结果我2月下定决心,5月入职,甚至都没赶上‘至暗时刻’。”2020年刚过半,奇点云实现了连续2个季度盈利,成为黑天鹅阴翳下的一道奇迹。

“水到渠成”

加入奇点云之前,地雷已和大数据、人工智能打了18年交道。

2003年至2011年,他在中科院计算所担任pFind蛋白组学搜索引擎架构师。

2012年,地雷加入阿里云,作为阿里大数据底层核心引擎ODPS的初代产品经理之一,负责ODPS的算法模块和对外开放。地雷和行在的“孽缘”正从那时开始——行在恰好是阿里数据中台的发起人之一。

注1:ODPS由阿里自主研发,是阿里数据交换平台(DXP)的底层基础设施,支撑着阿里金融、淘宝指数、数据魔方等关键业务。

注2:ODPS团队是当时阿里“平均级别最高、平均工资最高且没有之一”的团队,汇聚了阿里最高密度的精英人才。用地雷的话说,“十项全能的人”数不胜数。

打好技术基础后,次年,ODPS启动了与上层业务团队的合作,支撑阿里内部各项业务的开展。打个比方,地雷参与了ODPS支持蚂蚁金服金融风控领域的多种应用,其中包括现在人手一个、动态变化的芝麻信用评分;又如,强力加持菜鸟,搭建了菜鸟第一代物流预测算法

地雷,2013年,@阿里,杭州

从攻关底层核心引擎技术,到技术支撑内部业务,终于,2014年阿里云决定把整个ODPS对外开放,将大数据底层核心能力赋能给社会。这也是地雷在阿里云最为自豪的战果——开放前夕他在博客里写道:“从进阿里第一天起,我就只盯着ODPS对外开放这一件事,终于快等到了!”


 2014年底,完成ODPS与电商、游戏、医疗、智能穿戴等企业的对接和应用后,地雷离开阿里云,走上创业路,在聚道科技任GeneDock基因大数据平台CTO。医疗是一个专业的领域,需要沉下心深入积累。2018年,聚道科技完成B轮融资,创造了该领域融资额/团队规模的记录。次年,地雷加入云从科技,担任人机协同中台系统的产品总监。 2020年,疫情重击,很多行业都处于“至暗时刻”,地雷南下,加入奇点云。这一年,中国的大多数企业都已经站在了数智化转型的十字路口。无论是做什么的企业,现在都需要把数据当作核心问题去认真对待。“走量”已无法带来下一阶段的成功,必须借助数据去“精耕细作”。而数据中台正是企业进入DT时代、应对未知风险的重要基础设施。地雷认为,现在中台模式最早源于互联网公司。但是对于线下传统企业的场景,产品必须有所创新,“我们当年在阿里面临很多实际问题,原有的思路搞不定,不得不创新,后来有人给这套打法起了一个名字叫中台。今天线下商业面对的场景更复杂、数据更分散,一定需要更多创新,而不是生搬老套路。”因此,地雷非常认同AI这个方向:其一,AIoT是线下数据的重要入口与出口,不仅要为企业解决数据怎么用的问题,还要解决线下场景没有数据的问题;其二,要借助人工智能,让机器完成机器能做的事情,释放人去做更有创造力的事情。 “奇点云所创导的‘AI驱动的数据中台’,和我对数据中台的理想认知完全相符。”回顾走过的路,地雷说,“现在可以说是自然而然来到了最适合我的地方,水到渠成。”

地雷的生活日常

“长期主义”

此番地雷加入奇点云,担当数据中台产品(奇点DataSimba)的大任,他的思路很清晰——“长期主义”。数据中台这一行,无论是客户还是服务商,都应该意识到它是需要长期坚持的一件事儿。对于客户来说,“数据中台是进行时”,它不是部署一个产品就结束的,数智化转型的路很长,还有很多数据智能的机会值得去探索、深化和应用。对于服务商自己来说,选择了数据中台这条赛道,就意味着选择了一场“长线战役”。地雷认为做数据中台产品,首先,技术是平台侧的,对平台侧的投资都很难,要花时间去打磨,当然一旦做出来了,竞争对手也很难抄走;另一方面,做数据中台要舍得扎根行业,要耐得住性子去打透行业、沉淀行业know-how,才能保证在底下打“地基”的技术团队不会走错方向。在地雷看来,一个真正长远的数据中台公司一定会按照这个方式去布阵,而当他发现“奇点云作为一家创业公司,有行业专家团队,甚至还有专业的、收费的咨询团队”,“这样丰富层次的配置”让他一下子有了带技术研发团队的安心感和信心。“如果是为了去追数据中台的风口,不舍得坚持投入,绝对不会成功。”地雷谈到,“所以(做数据中台)很挑老板,老板是不是认同这是一个长线战役,并能持续投入——哪怕在低潮的时候,也要持续投入,克服最难点。之前在阿里合作直到现在,确认过眼神,行在是对的人。”


“正确的路”

如何赢得竞争?地雷认为做“龟兔赛跑”的乌龟就可以了。但他强调,除了勤奋,乌龟成功的一个关键前提是:乌龟一定要跑在正确的路上,没有瞎绕。地雷从3个维度规划“正确的路”:产品管理、工程管理和团队管理。

产品管理

数据中台研发和创造单个应用相比,难度要高一个数量级。架构上,必须设计一套干净强大、可拓展、安全、完整自洽的API,并在此基础上构建SDK、Console、GUI和编程工具链。即使是计算机系科班出身的程序员,90%也不清楚DSL编译器和IDE的实现原理。产品上,需要抽象和分解能力。不仅仅满足某个具体用户场景,而是必须把握各种应用开发者在各阶段遇到的各种问题。除了用户体验,还得注意统一的概念体系、设计哲学和必要的分寸感。因此,研发ToB平台型产品,必须规划好产品架构和路线图,不能无脑乱闯。产品经理该做的功课:战略分解、市场分析、客户访谈、竞品调研、用户体验走廊测试、“吃狗粮”……一项都别想偷懒。地雷说,他见过太多失败的团队,产品负责人放弃了谨慎的思考和周密的设计,就知道逼着团队拼命加班,然后指望靠蛮力一遍遍推倒重构。“这是用战术上的勤勉掩盖战略上的懒惰。”地雷举了华为的例子。华为之所以这么厉害,一个重要原因是华为特别重视产品规划,市场调研、需求分析很扎实,路标选点非常准。一旦有了路线图,华为往往会投入竞争对手三倍的研发力量,确保压倒性优势。(这也意味着,和对手同等资源下,另有2个“还不错”的方向被“战略性放弃”了,保证了“特别对的”战役有“范弗里特弹药量”)。经过产品经理团队周密而繁琐的工作,DataSimba的路线图目前已经规划到了27周以后,并在业务重点、关键概念和架构体系上,和销售团队、架构师达成了一致。

工程管理

好的软件工程实践,决定了技术团队的层次。需求的管理和分解是否专业、版本管理用得如何、Bug管理怎么样、代码审核是否严格、发布升级是否自动化、有没有单元和集成测试、迭代是否建立了节奏感……地雷说,到一个技术团队里呆几个小时,鼻子闻一闻,就知道几斤几两。技术团队如果这些基本功不好,摩擦力会越来越大。


“我用SAFe(Scaled Agile Framework,大型敏捷软件工程方法论)带项目,”地雷介绍,“它可能是唯一适合底层中台开发的管理方式。”
*注:SAFe,国际上最流行的规模化敏捷方法之一,将敏捷实践从团队级有效扩展至项目群级乃至企业级。底层核心平台(数据平台)的技术管理方法论不同于应用软件型产品:常规意义上的敏捷软件开发,团队不会超过20人,有时leader带着向前猛冲就能做出成果。而大型平台可能有上百人的技术团队,如何让上百人协同起来,同时保证整体迭代的节奏感,就需要专门的管理思路。微软的Windows团队、亚马逊的AWS团队、Apple的系统平台团队,都采用SAFe的方法论,阿里的ODPS团队亦是如此。18年走来,地雷对平台型团队的软件工程管理非常熟悉。这最早得益于在ODPS的战斗,在后期的创业实践中经历了多次检验,现在,他把这套方法论也带到了奇点云。

团队管理

来到奇点云,地雷定下了两个“小目标”:一,短期内,要把数据中台这个产品做得足够好;二,长期,打造一个精英研发团队,每一位成员都要有“端到端”的意识和能力(例如程序员,需要在“理解需求”和“测试”这两侧都很强)。地雷不认为团队管理有什么武功秘籍,反而常常都是一些繁琐的“体力活”,例如:每天早上站立晨会;每2个月做一次全团队One on One,给每个人辅导OKR(Objectives and Key Results,目标与关键成果);每个项目都做复盘;每次事故都做Post-Mortem(故障回顾);每个版本结束,都举行发布会、“吃狗粮”和黑客马拉松;建立起技术面试的规范和流程;建立新人入职手册和导师制度;把不合格的家伙干脆利索开掉……总之,让跟着你的人觉得有成长,不敢懈怠。建立团队信任,让团队里的聪明人超越“办公室政治”,互相合作取得双赢。这一点上,地雷很认同CEO行在挂在嘴边的那一句:“管理者需要脑力、体力和心力”。把团队当作产品去打造,看到团队成员们发展成为很精英、很职业的工程师或产品经理,是地雷做管理者的幸福感来源。

地雷(右一)和团队同学

6月,杭州入梅,南方的雨淅淅沥沥,落在梦想小镇创业大街23幢仿古的屋檐上。回想起冬去春来的那段时光,北京还没停止供应暖气,许多人问地雷:为什么要在疫情最严重的时候离开AI独角兽,去一个服务泛零售行业的小型创业公司?地雷终于在他的博客写下了回答:“这一次在赌两件事:第一、中国零售行业会很快恢复;第二、奇点云能够快速达到盈亏平衡、下一轮融资成功、杀出红海。我们来一起看看,接下来会发生什么事。”很高兴,这两件事我们一起赌对了。

地 雷 团 队招 兵 买 马

或许你对低调的地雷和他麾下团队产生了亿点点兴趣;或许你就是兼顾“理解需求”和“测试”两侧、“端到端”做事的王牌程序员;或许你已经参透PD不能只坐镇后方的道理,领头冲锋,为身后的兄弟们探路搭桥;或许你还未C位出道,但吃得苦中苦,学海无涯乐作舟;……那或许,你挺适合奇点云技术团队。


产品经理、后端工程师、架构师、测试经理等岗位火热招聘中,立即投递简历至邮箱:hr@startdt.com或点击阅读原文,直达招聘主页。各位“工兵”,速来“扫雷”!

再次出发

  我已经从云从科技离职。加入奇点云的创业团队,负责智能数据平台的产品研发。云从是非常优秀的AI头部企业,带给我不少成长,感激。

  在云从临近上市前离开,再加上最近的疫情和经济形势,很少人会选这个时点加入小型创业团队,尤其是一个专注于服务线下零售的toB供应商。

  你可以说我赌性很重。这一次在赌两件事:第一、中国线下零售行业会很快恢复;第二、奇点云能够快速达到盈亏平衡、下一轮融资成功、杀出红海。我们来一起看看,接下来会发生什么事。

  招人:架构师,产品经理,测试开发工程师,资深运维。JD稍后发出来,关键词是:杭州、ToB创业、大数据、靠谱、苦逼。

疫情和经济

  疫情的确会导致经济衰退。不过还有其他解读的角度。

  例如,互联网和AI迎来一轮爆发。李佳琦直播年销售额大约30亿。薇娅直播年销售大约100亿。前两天罗永浩第一次抖音直播,观众四千多万,销售额1.7亿。AI独角兽都在愁交付和供应链。线上吃掉线下,先进生产力替代落后生产力,这个大趋势反而被疫情加强。

  再如,没有弯道,老板们就必须回复常识,老老实实提高效率降低成本。这对toB是利好。对接地气的供应商是利好。

  又如,没风口,踏踏实实积累的人才会更值钱。缺少突破性创新的阶段,行业Know How和SOP就很关键。

  个人而言,我实际上看到了很多机会值得赌一赌。

  BTW:隔离了这么久,十分想吃兰州牛肉面。

AI和股票、搔扰电话、P站

  《攻壳机动队》有一集,金融大亨独自死在别墅里。然而他的资产还在网络中继续增值。20年后,这预言终于变成常规了。这个季度,美国股市中由人工智能管理的股权资产(交易所交易基金、指数追踪共同基金和债券)达4.3万亿美元,首次超过由人类管理的资产。

  国内2/3的营销和客服电话,已经不是活人。为了逼真,还会让机器人带地方口音,背景播放呼叫中心嘈杂的人声……一直用“你贵姓”打断对方,来判断骚扰电话对面是不是机器人。今天第一次遇到,对面机器人回答“我姓宋”,但是再问“你贵庚”又晕了。各位,有件事尽管简单还是要做,给机器人建立私人画像话术:多少岁、哪里人、有没有孩子、在哪里上的大学……大多数产品很重视语音识别算法和自然语言理解算法,却对话术管理不太上心。

  世界最大的色情网站(P站)推出了一款视频识别引擎,可以通过机器学习去识别视频中的演员、特征、场景,甚至可以根据三围、姿势等标签进行细分归类,然后通过算法进行精准推荐。

总算到家了

  昨天飞机晚点,落地回到家已经半夜了。刚刚我还在被窝里,闺女已经过来站在床边大声背起诗来了:“……万里赴戎机,关山度若飞。朔气传金柝,寒光照铁衣。将军百战死,壮士十年归……”

  有段时间没和销售一起打仗了。我发现自己还是那么嗜血好战,听到POC拼刺刀就兴奋。来来来,把竞争对手打得满地找牙!

  自从公司培训了财务三张表,就热衷于关注各大巨头的负债率。目前亚马逊是72%,京东是64%,腾讯是48%,阿里是36%。

艰难但正确的决定

  有个很年轻的90后女孩,之前是天使投资基金最年轻的合伙人,打算创业。朋友们都帮她改BP。非常优秀,在目前创投最寒冬的时刻拿到了很多资金。

  但是她认真考虑了2周,告诉大家,计划不够成熟,然后解散团队,把钱还给投资人。

  昨天我知道了,马上找她喝酒。庆祝她小小年纪能做出如此艰难但正确的决定。

  她转眼间已经收到了五六份offer。

[得到大学课程作业] 利用“银行家思维模型”经营人力资源信用

  创业GeneDock时精心经营雇主信用,也因此获益:

一、 招聘阶段

  GeneDock技术团队始终坚持:

  1. 至少四轮技术面试,前两轮必须现场写代码。

  2. 最初阶段可以远程视频筛选,但不允许只通过远程面试就发offer。

  3. 一票否决,CEO和我(CTO)也不能推翻。

  严格遵守原则导致错过了不少人才。但产生了很好的口碑。业内的同行、客户、猎头都对GeneDock的严酷标准有清晰了解。有候选人面试时说:“两年前就一心想来GeneDock,但自己在XX和XX两方面达不到GDer标准,我努力做了这些事……”

  我们还通过细节取得信任。例如其他公司的招聘岗位描述(JD)都马马虎虎,只有我们认真“原创”(不止一家大公司曾为抄袭GeneDock招聘文案而道歉或辩解);再例如,有前端工程师投奔的原因是,上家公司要复制GeneDock的网站,结果他在HTML源码里发现一句话:“呆在只会抄袭的环境有意思吗?给我们投简历吧……”

二、离职阶段

  和大多数公司不同,GeneDock在离职阶段花了很多心血。离职一般分为两种:工作不合格被解职,或者能力出色被挖墙脚。

  对OKR不合格的员工,不允许直接“杀人”,必须做一次面谈,由组长、我(CTO)和员工本人参加。组长负责详细列出导致不满意的事项,并和员工一起制定改进绩效的Todo List和deadline,给最后一次机会。坦诚沟通往往带来情绪压力和管理成本,但这是对员工负责任的行为。曾有人面临痛苦的绩效约谈,经历激动人心的“触底反弹”,半年后被评为优秀员工。也有同事虽然遗憾离职,却在多年后表达感谢,因为“当时公司让我心服口服”。

  对于跳槽的员工,不想让人家走恰恰说明有贡献。优秀员工离开,都会收到一份认真准备的推荐信,向未来雇主列举优点和贡献。于是,很多人跳槽后很久还主动给我们推荐人才和客户。我们曾有一次询问前员工谁愿意回来,一个月后就有“新同事”在All hands上打招呼:“大家好,很激动,我又回来了!”

  当然,也遇到过突破底线的恶性事件,对峙公堂;也遇到过资金困难的至暗时刻,夜不能寐……回头看问心无愧,不必细说。

  总之,雇主信用不仅体现在招聘阶段,也应该体现在分手时刻。在人力资源市场建立强大的信用带来巨大优势。2018年B轮时,GeneDock创造了“融资额/团队人数”比值的领域历史记录。

BTW:这节课提到如果要对信用资产”加杠杆“,必须保持警惕,个人非常赞同。

用移动数据预测特斯拉产能

  之前介绍过Bloomberg通过网上抓取VIN(车辆识别码)估算Tesla Model 3的每周产量(今天的公众号也会转发)。最近又看到Thasos的另一种手段。

  Thasos Group分析了特斯拉厂房范围内的手机信号,显示通宵轮班在6月到10月之间增加了30%,他们与对冲基金客户分享了数据。特斯拉7月宣布 Model 3产量几乎翻了一番,这一消息使得该公司股价上涨9.1%,而Thasos的客户则能提前预测这一结果。

  8月份,特斯拉在美国市场的销量超过了奔驰、宝马和奥迪。北京这里特斯拉也开始满街跑。这特别像诺基亚被iPhone干掉之前的情形。不管短期内有多少问题,长期看特斯拉一定会更好,这是本质决定的。

  看了一下官方网站,Thasos拥有一个高品质的手机位置数据库,可以做很多事。例如为梅西百货(Macy’s)、诺德斯特龙(Nordstrom)、Dillard’s(狄乐百货)和西尔斯百货(Sears)进行同店销售额和同店交易额的增长预测,平均误差不超过0.7%。Thasos从大约1000个APP获取移动设备的地理位置,这些APP一般都是位置相关的产品,例如天气预报或行车路线。

GeneDock做什么?

1. 为什么选择基因数据作为创业的起点?

  2014年,厦戎和我创立GeneDock(聚道科技),希望用数据技术改变临床诊疗,这个使命始终没变。

  创立那年,中美两国允许基因测序技术进行临床试点,通俗点讲就是医生可以依据基因数据给人看病了(此前十几年,人类基因组计划等项目处于科研阶段,还没有成熟到可以应用于一线临床)。所以我们先从基因数据的处理下手。

2. 最初面临什么业务场景?开发了什么产品?

  GeneDock最早的客户是基因检测技术公司和科研机构,典型的业务场景是这样的:每天,不同城市的测序实验室产生上T的基因数据,先进行生物信息处理,再把数据和报告交付给下游客户,交付周期有商业承诺。领导数据生产部门的CIO往往面临很多复杂问题:

  • 首先,原始的测序下机数据无法直接应用,必须经复杂的拼接比对计算方能获得基因突变信息,而且还要对突变进行注释和解读。这就需要调度巨大的计算能力,管理庞杂的分析流程,维护复杂专业的参考数据库和样本信息。
  • 进一步,需要进行细粒度的业务划分和配置:实验团队、生物信息团队和遗传咨询团队处于上下游的不同环节,不同角色应该给予不同权限;而不同的检测种类,也会导致分析步骤的巨大差异,需要专门的分析流程、报告模版配置和数据隔离。
  • 同时,需要对各检测种类的不同处理步骤进行成本统计;对关键数据的使用和修改进行安全审计;对业务全局信息提供仪表板和显示大屏。
  • 更复杂的情况下,客户经常把一部分数据生产工作外包,例如基因测序外包给大的测序工厂,或者遗传解读外包给专门的医疗信息团队,这就必须对跨组织的数据交付、数据质量进行管理,对安全进行审计,对业务进行定期结算。

  针对以上场景,从2014年开始研发名为SeqFlow的基因数据生产线。这个产品首先是支撑海量计算存储的数据平台,对稳定性、算法优化、高吞吐和弹性拓展能力的要求都很高,以保证客户业务的质量、交付周期和成本控制。在此基础上,SeqFlow还增加了企业级的管理大屏、项目管理、权限隔离和数据审计功能,以便管理者对基因数据业务进行高效管理。

3. 研发SeqFlow的关键点是什么?

  SeqFlow的研发重点在于硬核技术,举个例子:分布式调度方面需要把计算任务表达为有向无环图(DAG),这个DAG是瘦长型的,步骤很多,最复杂的癌症肿瘤数据需要上百个步骤,很多步骤依赖成熟的算法包。这就导致常见Hadoop、Kubernetes等框架都无法满足需求(其实今天的Kubernetes是可以用的,但是4年前Kubernetes和其他几种类似框架都不完善,测试时发现了很多致命Bug)。所以我们就自己从头开发了一套分布式计算框架,刚好可以加上很多企业级服务的特性,例如冷数据压缩、项目隔离、Policy鉴权、管理大屏、数据审计机制等。

  刚进入这个领域的时候,市场上30X的人全基因组数据的常规处理价格是800元。2016年的时候,GeneDock发布了全球第一个价格低于100元的人全基因组数据处理服务,同时,这个服务承诺很高的并行处理通量,以及低于万分之一的失败率。我们为整个行业的发展构建了工业级的高性价比、高吞吐量、高稳定性基础数据生产平台。目前,SeqFlow上生产的客户包括泛生子、艾吉泰康、微基因和华大基因等行业领头羊。

4. GeneDock为何向医院客户拓展?

  基因测序技术刚开始临床试点时,大多数医院对它不熟悉,所以把业务外包给第三方检测公司。随着人才和数据的积累,顶级医院开始筹建自己的分子诊断中心:招聘团队,购买软硬件,建立实验室……要在院内完成整个基因检测的闭环。因此,他们也就逐步有了数据平台的需求。

  经过几年的探索,GeneDock从2016年开始全力开拓临床客户。和工业界的生物信息工程师不一样,医生不会写代码,这就要求我们从PaaS上到SaaS,把诊疗场景的产品做透。具体场景包括门诊电子病历收集、实验室管理、生物信息数据处理、位点和诊断报告系统,以及在此基础上构建的数据仓库和人工智能系统,最终实现临床辅助决策支持系统(CDSS)。

5. 基因数据与临床结合,面临哪些核心问题

  临床诊疗是非常专业的领域,场景更加复杂。所以研发难度不仅限于技术实现,而在于能否拥有清晰的业务洞察,设计出专业而易用的产品。得益于早期客户的信任和帮助,团队有机会一次次跟随专家出诊和试验,逐渐理解遗传诊疗过程。举几个例子:

  • GeneDock以前开发过科研病历,以为这套系统可以直接搬过来应用于一线门诊。后来才意识到不对。科研病历往往简化时间维度,把几百个字段平铺开,而门诊病历必须体现诊疗探索过程:根据症状,按指南检测,每一步检测带来更多信息,又决定了下一步的检测治疗方案。
  • 门诊节奏非常紧张,有时医生甚至几个小时没法喝口水,临床数据系统必须提供友好的半自动化录入和专业的检索统计。
  • 涉及基因数据的疾病,往往是遗传相关的。这就需要一套非常专业易用的家系图管理系统,通过家系信息把病历信息、实验样品信息、生物信息流程、检测报告、诊断信息都串联起来。
  • 在实验环节,样品无论外送或自做,都需要精密的实验步骤管理和质量控制,各个医院操作规格不同,又需要自主配置,具体实验室环境下,实验员一旦进入无菌操作环节就必须一气呵成完成操作,这时候突然要求他摘下塑胶手套到电脑键盘敲入信息是不现实。这就需要对场景和交互进行细致理解和思考。

  关于更具体的场景和技术方案,我在很多公开场合分享过。例如2018年初在顾大夫沙龙做的报告《面向临床的基因型和表型数据管理》。今天的公众号会转发那次活动的总结,其中包含了我的PPT。

6. GeneDock的系统已在哪些医院投入实用?

  随着对临床诊疗的理解逐步深入,面向遗传疾病诊疗的数据系统逐步打磨完善,完整覆盖了从门诊病历、实验流程、生物信息分析直到生成诊断报告的完整诊疗流程。GeneDock的数据平台已经陆续在陆军军医大学第一附属医院、四川大学华西医院、上海新华医院、厦门大学附属中山医院、中国医学科学院肿瘤医院、中信湘雅生殖与遗传专科医院、江苏省苏北人民医院、首都医科大学宣武医院等多家客户处投入实用,还有更多顶级医院正在落地。

7. 目前AI是热点,GeneDock有什么成果?

  在清洗好的海量基因数据和临床数据基础上,我们和临床科研专家一起合作,利用统计机器学习方法训练出了非常有效的人工智能算法模型,能够从成千上万遗传变异位点中,自动选取出最有可能导致疾病的遗传病因。

  在2018年的美国人类遗传学会(ASHG)年会上,陆军军医大学第一附属医院(重庆西南医院)医学遗传中心与GeneDock合作开发的遗传性耳聋基因变异功能预测模型DVPred刚刚发布。这个模型明显提高了预测准确度,ROC曲线的曲线下面积(AUC)达到0.998,在遗传性基因变异功能预测方面表现出更高的准确性,灵敏度高、特异性强。

  我们正在和客户继续研发,希望类似“大数据宝宝”的案例越来越多,让更多的患者真正受益于数据技术和人工智能技术。

8. 创业四年下来,你个人有什么总结?

  反思当然很多了,有一些是关于沟通、招聘和管理的,不多说。

  关于复杂系统的工程研发,这两天重新看了自己2015年梳理的博客《思考:如何开发应用平台》。感觉当时写得还不错,现在回头再看,很多观点都被验证了。当然,侃侃而谈是一回事,事到临头真处理好不掉进坑里,又是另外一回事了。有些东西必须躬身入局经历一番才算真懂。这一期公众号,这篇老文章也会发出来。

  总而言之,能构建起一支专业的软件工程团队,很有成就感。

9. 完成了B轮融资,接下来重点是什么?

  GeneDock会和越来越多的专家团队合作,对更多业务领域进行探索。不仅限于简单遗传模式的疾病,也开始涉及癌症、帕金森等复杂疾病,逐步覆盖生殖三级防控(婚前、孕前和产后)的各个阶段。

  具体到眼前这个阶段,随着标杆客户案例的建立,已经很多公司和医院的业务开始落地。项目交付能力至关重要,这取决于整个团队的软件工程水准:从需求分析、产品设计、研发迭代、测试发布、部署上线……要有一整套成熟高效的工程体系。这方面是GeneDock团队的强项。当然,团队还需要补充很多人才。

10. 对于想加入GeneDock的人有什么建议?

  随着B轮融资的到位,资金不再是问题,我们需要更多的程序员、基因数据工程师、人工智能专家和分子遗传学专家,对临床和基因数据进行充分的挖掘和建模。更详细的职位描述,欢迎访问 https://www.genedock.com/joinus/

  除了具体技能,个人想提醒的是,创业公司都会有一定的不确定因素。投简历之前一定要想清楚:心态上来说,创业变数多,需要有很强的抗压能力;能力上来说,需要你独当一面,有很强的落地执行力。GeneDock初步打开了局面,现在加入对个人而言有很广阔的成长空间。欢迎入伙!