有人告诉我《易经》里有个卦象叫“地雷”,意思是从0到1,不急于求成,按部就班,一天比一天好。
Category Archives: 咬文嚼字
云原生数据中台的What、Why、Who、How和Where
WHAT:云原生是什么?它有啥前世今生?
简单说,云原生(Cloud Native)是在云上构建和运行系统的方法论。最早移植上云的“非原住民”应用程序,往往还沿用私有化部署的技术架构,无法充分发挥云基础设施的优势。随着客户应用的深入,系统必须按照IaaS和PaaS的原理进行重构,以便跟上业务的爆炸性增长。
按照CNCF(Cloud Native Computing Foudation)定义,云原生一般包含CI/CD(持续集成持续交付)、容器化、微服务、存储计算分离、跨云多域、元数据管理等技术要素。
老实讲,从我这种从业20年数据技术老兵看来,这又是一波buzzword,很多东西二十年前就有了,十几年前就已经成为互联网技术团队的标配。例如,2007年Google已向Linux内核社区贡献cgroup补丁;再如,2008年腾讯阿里招收计算机专业的应届生的面试题里就有CI/CD的问题;2013年我在阿里云ODPS团队时,ODPS的调度器和执行器已加上了cgroup能力。
WHY:投资人不傻,为什么这些概念在创投领域突然变火?
云原生暗合当前行业的发展逻辑,才会受“追捧”。我猜所有重要的创新都要被“发明”两次,一次是从无到有生出来,一次是出圈。
最近业界有个新闻,2020年,中国IT预算里超过50%的钱花在了云上。这是一个里程碑时刻,在中国这个喜欢私有化部署的市场里,云终于赢了。
大量的应用在云上,就遇到成本和效率的问题。举2个例子:
第1个例子,云和大数据运维技术含量较高,很多看机房重启机器的传统运维工程师无力承担。但是线上数据、计算和应用规模还在以每年N倍的速度增长。如果不采用CI/CD而是坚持传统的人肉运维,先别说这种运维工程师的薪酬很高,你可能都招不到这么多合适的人。
第2个例子,客户如果把Hadoop不加修改直接部署到ECS节点上,数据通过HDFS存在云磁盘上成本会非常昂贵。客户必须修改HDFS底层,把数据存到对象存储上去。
成本和效率问题推动智能数据平台必须走向云原生,从而为用户带来如下收益:
1. 提高研发效率通过微服务、CI/CD、对象体系、DevOps等一系列技术,提高代码开发、测试、发布效率,降低迭代成本。
2. 降低运维成本同样,上面这些技术也可以实现开发及运维高效协同,有效提升对故障的响应速度,实现持续集成和交付,使得快速部署应用成为业务流程和企业竞争力的重要组成部分。
3. 降低存算成本大数据基础设施的存储计算成本惊人。存算分离和容器化能够更高效地使用IaaS资源,降低存储成本。存储和计算节点分离后,可以在不对存储进行扩容的情况下快速增加计算资源。另一方面,单个容器的启动时间更快,占用空间更小,而且可以根据实际应用的大小来弹性分配资源,无需额外采购服务器。
4. 提高治理效率数据治理是非常重要但“脏”且繁琐的工作。使用跨云治理、元数据管理等技术,会大幅度提高企业积累数据资产的效率,降低安全风险,提高供应商的多样化。
WHO:所有人都在阐释云原生,哪个更符合客户诉求?到底是“谁的云原生”?
讨论云原生时,应该问清楚:“谁的云原生?”AWS、阿里云、微软云、腾讯云、华为云、京东云、Google云……每一家都推出了自己云原生技术,以吸引客户搬上自己的云。但技术接口的中立性和跨平台性被有意无意忽略了。
奇点云作为“AI驱动的数据中台”创导者,是标准的乙方数据智能技术供应商,服务于泛零售、金融、电信等行业,其中不乏各行业的头部企业。所以我们有动力做下面两件事:
1. 尽可能优化架构,降低数据应用在IaaS上的计算、存储成本。
2. 实现跨云数据治理,帮助客户摆脱某个特定云平台的绑定。
总而言之,和客户站在一起。
你会发现,在美国,尽管AWS的产品非常强大,但是snowflake和databricks依旧服务了很多世界五百强企业。原因就是这些头部企业需要把自己的IaaS供应商多样化。逻辑很类似。
所以“奇点云的云原生”,相比常规定义,多强调了几个因素:对象体系、跨平台、自主可控。我们的产品支持AWS、阿里云、微软云、腾讯云、华为云、京东云、Google云,并实现跨云的多workspace管理,能实现客户数据与应用的跨云治理和迁移。而且系统基本的架构体系设计更开放、更安全、更容易集成。
HOW:对于云原生,数据领域有什么倾向?具体通过哪些技术要素实现云原生?
我们先回顾一下数据技术的演进阶段:
阶段 #1 关系性数据库出现,SQL统一数据开发工业标准,开始区分OLTP和OLAP。问题:随着业务成长,数据量爆炸,尤其是互联网影响的深入,传统关系型数据库逐渐扛不住海量数据的压力。
阶段 #2 大数据技术出现,支撑海量数据的处理,OLAP本身又被分成了离线和实时。问题:针对不同场景的各种大数据引擎不断出现,反过来又刺激了更多数据的生成。海量数据的成本开始变成沉重的负担,如果不能把数据变成“资产”,帮助业务赚钱或省钱,就没法持续支撑大数据基础设施的持续投入。
阶段 #3 数据中台出现,提出一系列的业务方法论,强调积累数据资产。问题:数据中台在互联网公司的实践获得了相当大的成功。但是在其他行业,如果纯粹100%生硬照搬互联网的业务架构和产品形态,会遇到很多水土不服。举个例子,传统行业的企业有大量的线下场景,需要考虑很多数据集成、跨平台治理、数据安全、自主可控的问题。
阶段 #4 数据智能深入场景,AI成为数据中台的入口和出口,业务和数据上云趋势加快,多域数据治理成为刚需,国内用户愿意为自主可控技术买单。
你可以看到,每一阶段技术都是为了解决上一代问题诞生的。 所以,大数据领域的业务特点会推导对云原生的一些倾向性:
1. 数据中台存储海量数据,且作业高吞吐高并发,对存算分离的各项指标要求明显高于其他领域的应用;
2. 大数据集群规模大进程多,天然需要微服务治理和其他智能运维技术;
3. 客户对数据安全、数据确权极其关注,加上toB的分级多域数据治理场景非常复杂,产生了对跨平台技术、数据安全技术、合规数据合作技术的强烈需求;
4. 由于目前的国际政经形势,自主可控的大数据引擎,对国内企业而言是一个刚需。
想清楚了这些,“奇点云的云原生”具体做了如下的研发:
# 容器化编排:容器化本质上是一种虚拟化技术,一台主机可虚拟出上千个容器。单个容器的启动时间更快,占用空间更小,而且可以根据实际应用的大小来弹性分配资源,无需额外采购服务器,加快研发速度。
# 对象体系:根据现有业务抽象出核心对象,以标准RESTful风格提供API服务,解耦核心对象与业务层服务,以应对不同环境、不同业务场景的需求。这一系列正交的核心对象就构成了平台对象体系,上层业务可在此基础上构建应用,高效演进。
# CI/CD:通过版本管理系统和DevOps基础设施,实现自动化测试和持续集成。一个典型流程是,程序员提交代码到特定的tag,触发测试接口自动化测试脚本+开发单测脚本(偏提交代码新功能的)执行并发送报告。由此实现测试、发布和部署自动化。在此基础上构建特定的数据环境,对重要接口和链路进行自动化检测。
# 存算分离:如果把Hadoop、Spark等常规开源大数据引擎直接应用于云主机,海量数据带来的存储成本和吞吐压力,会很快“压垮”客户。因此,必须引入中间缓存实现计算存储分离,将数据存储到对象存储上,同时兼容HDFS协议,能够根据业务需求进行弹性扩容,就能大幅度降低成本,提高集群性能。
# 跨云治理:在AWS、阿里云、华为云、腾讯云、京东云等平台,实现统一账号、权限和审计的多workspace的兼容管理,并进一步提供数据安全和可信计算方案,从而提高基础设施的可控性和安全性。
# 元数据管理:对数据的结构、指标、标签、权限、上下游血缘、生产作业等元信息进行规范化管理,建立智能数据治理体系,支持数据盘点、安全审计、血缘分析、关键分级等应用,最终实现数据资产化。
WHERE:客户在哪些场景用上了云原生数据中台?
简单举几个客户应用我们的云原生数据中台DataSimba的例子吧(均为真实案例,保密原因,不能指明):
案例 #1 某互联网APP,在海内外都很受欢迎。由于地域和法规的要求,他们必须在多个国家的多种IaaS上实现数据生产和合规隔离,例如:在印度部署1个workspace在孟买AWS上,在美国部署1个workspace在Oracle云上,在中国部署1个workspace在阿里云上……同时又实现账号权限、数据审计和安全策略的全局管理。
案例 #2 某大型电子设备制造公司,由于战略和业务的原因,必须把自己IaaS供应商多样化:部署1个workspace在华为云上,以便对接政企系统;部署1个workspace在AWS上,以便满足海外客户的审计需求;再部署1个workspace在阿里云上,以便支持和阿里云的战略合作……同时又要进行全局的数据资产管理。
案例 #3 某大型零售品牌集团,本身就有多个互相竞争的子品牌,彼此要求数据做必要隔离和客户隐私保护,同时总部又要进行全面的数据拉通。另一方面,该品牌商会对接多个流量电商平台:在阿里云放一个workspace支持双11,在京东云放一个workspace支持618。再加上几十个线上线下系统的数据的集成和拉通,形成了很复杂的分级多workspace的云原生数据治理体系。
案例 #4 某流通业的大型集团,各个分公司比较独立,IT经费充足。这时候总部上一个分级数据治理的多workspace数据中台,旗下比较大的分公司有自己独立机房的可以单独部署workspace,而小一些的公司在阿里云或华为云上开通workspace。总部对所有workspace拥有账号管理和审计的权利,同时控制住数据建模规范标准和指标的版本发布。
不同行业的不同企业,搭建出不一样的云原生跨平台数据治理体系,这其中的业务逻辑复杂微妙。我们再对比一下互联网大厂的数据平台——大一统式的数据打通,跑在几千台节点集群上,就可以发现两边产品上的着眼点并不相同。
最后回顾前面讲的几个关键点:奇点云的第三方立场,奇点云团队对大数据、云计算、人工智能技术的沉淀,奇点云对泛零售、金融、电信等行业的深入理解,以及最重要的——上面这些真实客户案例,都让我们能自信地说,奇点云是中国企业数字化转型的“must-have”供应商。

顺便打个广告:技术团队正在火热招聘中,欢迎数据工程师、算法工程师、后端工程师、DevOps工程师们投递简历:zhaopin@startdt.com。
本期作者 | 王乐珩(地雷)
奇点云数据智能平台DataSimba总负责人,阿里大数据底层核心引擎ODPS初代产品经理。曾支持蚂蚁金服、菜鸟等算法与应用建设。
数据中台的终局是将数据变现
如何真正理解数据中台?只有大厂才需要考虑数据中台吗?数据中台的出现会给企业现有的战略、业务、技术带来哪些挑战?
与其讨论什么是数据中台,泛零售企业对「如何利用数据中台解决业务问题并带来盈利」更感兴趣。因此,如何利用好数据中台成为新的增长引擎,正成为一门新课题。在实践过程中,我们发现很多泛零售企业不清楚如何真正用数据中台有效解决业务问题,想要盈利也变得愈加困难。
9月9日「数智·泛零售」03课,地雷老师的分享中提出了建议,在实施数据中台前,泛零售企业必须梳理3个问题:
1、数据中台在泛零售行业中是成本中心,那老板为什么要斥巨资投资做数据中台呢?
2、数据中台落地的每一步,能带来哪些业务收益?上数据中台不同于上ERP、CRM及内部管理系统,数据中台是非常底层,刚开始业务部门感受不到它的存在,需要老板有战略决心。
3、设想中的数据应用,涉及到哪些现有系统和数据?
从以上3个问题总结,其实需要从战略、业务、技术实现三个层面去考虑。
如果你是一位有着多年数据中台建设的老手,看到某些指标,可能你就可以感受到项目实施的成功率。比如说业务部门比IT部门着急,催着IT部门上线,那就对了。意味着有了清晰的战略和业务出口,最忌讳的是先做数据中台,将数据汇集并存起来,未来再进行数据挖掘及变现。
数据中台VS传统数仓
40年前就出现的数据仓库概念和今天盛行的数据中台有何差别?尤其在技术上又有什么差异性呢?我们听到最多的可能是以下这两种回答:
1、是IOE为代表的传统技术栈,转向Hadoop等开源大数据技术。
2、增加了类似离线计算/实时计算/数据资产/数据API这样的功能模块。
再仔细想想,仅仅是技术因素吗?技术当然会更新迭代,数据中台在技术上比传统的数仓在处理的数据量上大大提高,如果仅仅考虑至此,当被问到老的技术撑不住新的业务了吗?在传统的线下零售情形下Oracle就搞不定吗?这些问题是可能是矛盾的。
我们认为数据中台是业务概念,而非技术概念。相比传统数仓,数据中台离业务更近,能更快的响应业务和应用开发的需求。数据中台的首要出发点并不是数据,而是业务,帮企业解决业务问题,让企业的业务效率更高。
大数据时代,数据是一种「石油」,直白地讲,数据经过汇聚、生产、服务,是可以给企业赚钱的,也是所有业务的出发点。
数据中台的终局是什么?是将数据变现,让数据本身「生钱」。
同时,这也是数据中台兴起的初心,和传统的数仓不同在于,传统的逻辑上,这些都是成本中心,但数据中台是一门新的生意,将数据攒下来进行生产并变现。
意味着数据中台项目在一开始就要奔着生产数据中台产品并且能卖钱进行建设,这也是上一代和这一代在业务上最本质的区别。 如果实施几期之后,开始规划计量计费功能,那么就对了!因为正在朝着对外服务并进行收费的方向进行。 在划分数据中台的功能模块时,一种典型的思路,采用典型数据开发的技术导向,一级信息架构类似这样:离线计算/实时计算/数据资产/数据API……
不以技术划分,而是以数据生产的场景划分。如果开始按照数据开发、数据运维、数据服务、数据资产等岗位场景组织产品功能,事情就对了。
泛零售业务的技术挑战
一般泛零售企业没有阿里双11那样的场景,应将重点应放在哪里?产品形态又如何?
泛零售企业都是线上线下协同的,既有线下场景,又有线上场景,数据来源也极其庞杂。泛零售企业数据用的时候实际场景也是混杂的,需要跨域协同。
对数据治理来说,一方数据、二方数据、三方数据的依次处理,与业务都有强关系。光有数据而不能赋能业务的,都只能算是半吊子。
未来所有的企业核心都会变成加工数据的企业,虽然泛零售行业数智化转型不一定保证成功,但不做数智化未来注定失败。
当泛零售企业发现:数据问题导致变现出现困难时,就是该上数据中台的时候了。数据主动向业务前端靠近,这也是DT时代数据变现的发展大趋势。

Trillion Dollar Coach、《刷新》和《具体生活》
Bill Campbell是我个人的职业标杆之一。之前写过BLOG,列举了搜集到的Bill Campbell众多有趣事迹。
前两天发现Google的前董事长Eric Schmidt写了一本关于Bill Campbell的书 Trillion dollar coach,(中文版名叫《成就》,无力吐槽)。赶紧买来看。
书里很多内容,我之前碎片化搜集的时候已经知道了。不过还是有很多关键信息。
比如,我一直很疑惑,为什么如此多的硅谷创业明星都去接受Bill Campbell的培训?答案是Bill Campbell加入了著名风险投资KPCB,专门负责与KPCB投资的创业者定期“聊天“,这是一种投后服务。有时候,他还会代表KPCB在董事会里占据席位。这也解释了之前BLOG里提到的那个问题(在Twitter公司激烈的人事动荡中,Bill Campbell 扮演了一个凶狠而不忠的角色),他的最终立场是董事会里的风险投资人,而非CEO的私人顾问。
之前写过,Hit Refresh 这本书比 Principles 给我的触动更大。而Trillion dollar coach的三观恰好和Hit Refresh一致。两本书都认为管理的关键,是如何在一群聪明的、互相竞争的牛人中营造信任和坦诚,让团队尽可能跳出低级的办公室政治。你甚至能发现,Satya Nadella上任之初改变高管开会的形式,几乎和Bill Campbell的做法100%一样。(我在云从科技的上司BOSS T是硅谷十几年老兵。读完Trillion dollar coach我才意识到,BOSS T在部门内也特意以这样的形式来组织总监例会)。记得读Hit Refresh是在聚道的最后一年,我照着它做了很多实践,今天回头看,为此骄傲。
顺便吐槽一下,18年 Principles 简直刷屏,朋友圈一水的小学生式读后感,居然没有人对其表达批判性思考。个人觉得这书当然有价值,但被高估了。其实体现了,投资圈里那些赌徒希望找到永远赚钱的金手指公式的妄念。
至暗时刻,总是希望有一个像Bill Campbell这样的教练,就不会那么迷茫痛苦了。等走出来以后再看,事非经过不知难,行万里路读万卷书,keep calm and carry on,我们自己就可以变成像 Bill Campbell 那样的人。
最后再说一本书,最近读完了吴军的《具体生活》,还行。
大航海时代的全球人才竞争,两条史料
里斯本国家档案馆记载,1627年3月6日,负责印度果阿的火炮生产的葡印商人,亲自就两名铸铁经验丰富的中国技师的行踪禀告葡萄牙国王,希望能够获得准许对关键工程技术人才予以优待。
康华丽号风帆巡洋舰1812年在印度建造。总工程师Jamsetjee Bomanjee是印度人,出身造船世家,已是第5代担任首席造舰师(Master Shipbuilder)。30年后清朝在康华丽号上签署《南京条约》,Jamsetjee Bomanjee的儿子已当上第6代首席造舰师。
可以对比之前提到过的,徐光启和戚继光时代的几何和火器。归根到底,最大的问题并不是武器制造,而是系统对人才和知识的兼容性。
《亚历山大远征记》和《波斯帝国史》
《亚历山大远征记》和《波斯帝国史》对照着一起看,会更有意思一些。前者是从希腊人的角度去描述,而且只写了亚历山大登基后的短短十几年。后者是以波斯人的视角,跨度更大。
首先,庞大的波斯帝国为啥不堪一击。
从《亚历山大远征记》这边来看,波斯王大流士三世就是个窝囊废,拥有几倍的兵力,每次一打仗就临阵逃脱,放弃还在前线苦战的部队。被亚历山大追在屁股后面几千里,最后被自己的部下绑架并虐死。对手甚至很难理解这哥们为啥这么怂,好歹也是大帝国的皇帝,带着几十万精兵良将,幅员千里的疆域……然后,从《波斯帝国史》这边看,你就知道此前波斯帝国里发生了什么,那么多乱七八糟的宫斗和暗杀、叛乱和战争……大流士三世面对亚历山大的时候,这个看似巨大的帝国内部已经腐朽无力人心涣散。客观来说,大流士三世在被亚历山大击败之前,好歹收拾局面,有点中兴的意思,名声还不错。当然也可能是因为他上台不久,弱点还没暴露。
反过来,希腊人这边,因为了有了几十年前的色诺芬万人远征(又要狂热推荐色诺芬的《长征记》,我的最爱),早已完成了对亚洲大陆的信息收集、火力侦察和信心积累。(参考决战前亚历山大对军队发表演说,反复提到色诺芬远征)。
其次,看看亚历山大阵营内部的微妙故事。
亚历山大从小师从亚里士多德,18岁的时候就以太子身份领军取得辉煌军事胜利,人望很高。但是因为父王腓力二世新娶了一个美女,他也曾陷入过失宠的危险境地。史书上语焉不详,但看得出来当时人们都在怀疑他和他母后对腓力遇刺这件事,事前知情不报。
从腓力二世时代就为马其顿效力的老将军帕曼纽,位高权重,经常是亚历山大出去远征,留下帕曼纽作为代理人镇守后方。远征波斯的时候,帕曼纽是起重要战略作用的独当一面指挥官。从战场指挥决策上来看,这位老将军要比亚历山大沉稳很多。这个人就因为儿子陷入谋反传闻(看书里的春秋笔法,不一定是真的,可能是政治斗争被卷进去),就在前线被仓促处死。其实我是挺替他不值的。
最后就是亚历山大的诡异死亡。你真相信那个年轻力壮的皇帝,三十岁就莫名奇妙突发疾病病死吗?史书上完全不掩饰对亚历山大身边人的怀疑。
第三,看看马其顿的军事技术。
以前提过很多次了,中国古代的史官很少真正上战场,更别提指挥部队,因此我们的史书很难细致客观地描述战争。而古代希腊罗马的贵族们,像色诺芬和凯撒,都留下了不少精彩的战争笔记。《亚历山大远征记》的记录主要源于阿瑞斯托布拉斯和托勒密的笔记。两个人都是追随亚历山大转战千里的高级将领,而且托勒密日后成了埃及国王。所以对战场的描述相当翔实。每次战役,战壕和营地怎么修,后勤和侦查怎么做,马其顿重步兵方阵怎么部署,弓箭手怎么策应,骑兵怎么包抄侧翼,作为预备队的皇家卫队什么时候投入战斗……都写得清清楚楚。这一套战争技术,正是希腊,以及之后的罗马帝国的看家本领。
阿西莫夫的《基地》系列
列书单.2016.9.17
最近几周搬家,整理书架。居然挖出来十几本以前买来却没读的书。白天干体力活儿,晚上躺在地板上听着音乐读书。
读了迈克尔·道布斯的《纸牌屋》,米兰·昆德拉的《玩笑》,井上靖的《楼兰》,北岛的《蓝房子》,高晓松的《如丧》,虹影的《K—英国情人》,朱锡庆的《知识笔记》,伊恩·麦克尤恩的《只爱陌生人》还有朱德庸的《跟笨蛋一起谈恋爱》
《诱拐》和《贼巢》
手头没新书看的晚上,去书架里挖掘一下,总能有惊喜。今晚翻到了斯蒂文森的《诱拐》,还有一本詹姆斯·B·斯图尔特的《贼巢》。《诱拐》已经在我的书架上放了8年,《贼巢》放了5年。模糊记得当初都是买回来翻了几页,没提起兴趣,就扔下了。
《诱拐》是典型的18XX年的小说,惊险刺激,最适合十几岁的时候读。不过你有没有注意到,200年前英国社会已经有非常浓厚的契约体系了。即使是偏僻山村里的一个孤儿的一小点财产继承问题,也会牵连出一大堆法理逻辑和信托安排。中国的话,直到我们这一辈才有这个意识吧。这几年周围越来越多的同龄人开始设立遗嘱并定期更新,明确自己意外去世后老人和孩子的财产安排,并确保自己特别讨厌的亲戚的继承次序被放到最后一位。
《贼巢》不是小说,是金融记者的深度报道。我还清楚记得,自己是在10年前(06年)白鸦的BLOG上看到《贼巢》的读书笔记,留下了印象。好几年以后逛书店碰到就买了。这书最好玩的是把一个故事讲了两遍:上部叫“违法”,是讲四个人是怎么入行怎么勾兑到一起的;下部叫“追捕”,证监会和地方检察官如何逐步揭露犯罪事实,其实用旁人的视角又对四个人的故事做了一次倒叙。微妙的阅读体验有点像《冰与火之歌》。这书气魄很大,怪不得能得普利策新闻奖,甚至动摇了大众对金融行业的信任,引发了1988年的股灾。
又来上海
2016第三届科学数据大会在上海复旦大学举办。8月25日下午我会在高性能计算与大数据分会场做一个分享,欢迎大家来听。明天我会去听精准医疗分会场的报告。希望认识更多朋友。最关键的,希望收到简历和人才推荐。
最近开始疲惫和焦虑。有一天早起,居然有溜号不上班的念头。对我这种跳着踢踏舞上班的人来说,这很少见。很长时间没休假,看来需要充充电了。
到上海的高铁,买了一本海莲·汉芙的≪查令十字街84号≫,几乎不喘气读完。真棒!同时发现自己彻底放松下来了。然后突然特别困,眼皮都抬不起来,睡得不省人事,直到列车员查票。发社交网络称赞,才被科普,火车站书店之所以会放一本小众的文艺作品,是因为最近有一部畅销电影提到了它。
刚到上海,收到邮件,有个客户申请GeneDock的邀请码,看地址离我很近,于是去拜访。见完客户,又发现离贝壳社上海的办公室很近,就跑去玩。遇到了以前就认识的朋友,才知道他找到了合适的合伙人,获得了贝壳社的投资,赞!然后又遇到了另外一个创业者,基因行业最著名的猎头。有些话题只有创业的人才能真正互相理解。(聊了好久,我差点耽误了晚上的视频面试)。