Category Archives: 流水帐

4月11日的NGS创新开发者大会,GeneDock有个分享

  我们会参加明天(4月11日)的NGS创新开发者大会2015。GeneDock的CEO李厦戎博士会在大会上做一个报告。大会的具体日程点击这里。测序中国和基云惠康主办组织得非常成功,据说报名人数超出了预计的50%,会场已经彻底装不下了。很多圈子里的朋友都在,希望和大家多交流。以前没见过面的同学可以在会场上给我的微博账号 @还是地雷 发消息互相找。

《教父》、公务员和创业

  这个BLOG已经写了10年了,也是不容易。先播放广告,GeneDock在招人,前端、后端、生物信息都缺人。点击这里…… 提醒一句,A轮之前和之后加入,会有很大区别。

  大年初一初二,用两天看完了小说《教父》。以前就听说古龙最有名的武侠小说《流星蝴蝶剑》是照搬了《教父》的故事框架。所以边读边回想古龙小说的情节,有意思。

教父

  《教父》的真正主角其实是那个独特的社群:西西里黑帮本质上是个企业,所有杀人放火都是生意。另外,里面描述当时美国政府、立法、司法机构的腐败,和如今的中国有好多神似的地方。所以推荐想创业和想当公务员的朋友闲暇时看看这部小说。

  说到创业和公务员。以前看过一部有关创业的韩国片子,老爸对儿子说:“要是敢去当公务员,就打断你的腿。”

  因为招聘,最近有很多机会听年轻人讲他们对事业的选择。上次博客提过,对于创业团队而言找对人无比关键。只有天性喜欢远航的水手才适合寻找新大陆的船队。

  现在是个有趣的时间点。一方面,到处都有文章在讲“经济萧条要来了”,很多年轻人挤破头考公务员;另一方面,几乎每天都能听到周围同学、同事、朋友下海创业的消息。谁也看不清未来,每个人都在下注而已,所以就变成了世界观和性格的偏好问题。别的都可以聊,辩论三观实在太累。寻找同类就好了。

  到了我这个岁数,同龄人已经明显分化,有些人建立了独特气场和个人品牌,而有些却已经变成空壳。想过什么样的生活,想变成谁,刚毕业的年轻人一定要早点琢磨清楚了。集中精力塑造自己,别朝三暮四,别耽误时间。看好身边的某些90后,不在于现有基础,而是因为他们比旁人更清晰的愿景。比起我们这些留有旧时代痕迹的70、80后,他们不纠结。

  当然很多90后的基础实在好得让人眼热。例如前一阵刚刚参观过赵柏闻的创业公司,他们正在做一些真正疯狂而有趣的东西。这种玩法以前只在硅谷的故事里听说过。

  大家春节快乐。2015,我们一起挽起袖子大闹一番。

2014再见!

  从阿里辞职创业两个月了,忙得没心境写BLOG。实在对不起订阅者。今晚给wangleheng.net域名续费,顺便上来敲两句,免得大家以为这里死掉了。接下来的更新节奏会逐渐恢复正常。

  先傲娇一下!念念不忘好多年,终于迈出关键一步。给自己点个赞。一个已经创业的本科同学给我发来贺电:“尝试改变世界,或者等死。很高兴又出现一个人选择了前者!”

  回来继续写总结。2014年初的这篇BLOG已明确提到今年要做的两件事:完成ODPS对外开放商业化,然后着手准备离职创业。现在看都做到了。我给自己打个90分。扣掉的那10分源自ODPS商业化过程中出现的大量问题。经验教训记住了。同事朋友们的善意也记住了。

  关于新公司的行业背景和介绍,可以参考我们在Qcon上的分享图灵专访。目前在宇宙中心——回龙观的居民楼里,距离地铁站步行2分钟,逆峰上下班。下面这张是我们的门神。

qintianzhu

  我们在招人。点这里看职位。公司提供机械键盘,人体工程学椅子,多显示器,不限量vpn,正版开发环境…这些要求对程序员来说并不过分!牛人把要求在简历里列清楚,我们赶快办入职手续吧:)也好尽早给推荐你的朋友发iPhone6。什么?女王范的美女产品经理?这个…快有了快有了…

pingmu

  互联网创业,工号是个位数的员工大都是在A轮之前加入的。这些同学的工作能力未必Top 1%,但往往拥有清晰的决策树,知道平衡点在哪儿,知道自己不要什么。观察每个人如何取舍、如何谈判并最终入伙是一件很好玩的事。Welcome aboard,各位GDer!系好安全带,这会是一段奇妙的回忆。

  至于我自己,纠结的时间不长。答应合伙人会出来一起创业的那天晚上失眠了,毕竟要放弃很多,例如大笔阿里股票,后来在手机上给某慈善基金会捐款了100块,平静下来,然后去睡觉。从那天开始,每天都比前一天更确定自己的选择是正确的。

  其实最近看到大量阿里的同学都出来。其中玄橙老大也看好生命科学这个行业,加入了即将上市的华大基因。他还写了一篇文章回忆叛逃的过程,据说最早还是被我忽悠的。

  如果你对创业感兴趣,又不太了解。推荐9月起YC的新主席Sam Altman与Stanford联合开的一门创业课,叫“How to start a startup”。我每晚和女儿玩游戏、哄她睡以后,就在手机上听一课。收获很多。这里是视频课程的网站。另外,罗胖在《逻辑思维》这一期视频讲得也很有趣。还有,我在读Startup: A Silicon Valley Adventure

  2015年要来了,祝大家都离自己的梦想更近一步。

列书单2014.10.12

  今年逛书店和买书的次数很少。下面是到目前为止买的部分书。有马尔科姆·格拉德威尔的《异类》,萧红的《呼兰河传》,托妮·莫里森的《所罗门之歌》,阿兰·德波顿的《写给无神论者》《亲吻与诉说》,艾丽丝·门罗的《逃离》,迈克尔·道布斯的《纸牌屋》,朱锡庆的《知识笔记》,朱德庸的《大家都有病》《大家都有病2》,Dan Sanderson的《GAE编程指南》,千叶滋的《两周自制脚本语言》,桂曙光的《创业之初你不可不知的融资知识》


                        

健康大数据创业团队诚邀您的加入

  我们是一个健康大数据创业团队,已经拿到百万美元天使投资。创始成员包括前阿里巴巴数据科学家、前阿里云数据产品经理,核心团队长期工作于阿里、百度等业界知名公司。我们怀揣用数据技术推动健康领域革新进步的梦想,期待您与我们结伴前行。
  我们在北京。
  如果你是一个Geek,和我们一样渴望用互联网和数据技术改善自己和他人的生活质量,请无视下面的职位描述,直接把简历砸向 igenedock@gmail.com ,我们会在第一时间跟你联系。

系统架构师
我们希望您擅长根据业务需求构建和优化可扩展的计算系统,对分布式存储/分布式计算/并行计算系统架构如数家珍,并热衷跟进前沿计算技术发展。
工作职责:设计系统架构,带领团队实现面向海量数据的可扩展计算系统。
要求:
  1. 深入了解Mesos/Yarn或其他分布式资源管理系统
  2. 熟悉分布式计算领域作业调度、元数据管理、数据质量监控等方面
  3. 熟悉Hadoop生态环境,有系统级开发经验
  4. 优秀的沟通能力和团队协调能力
其他
  1. 熟悉亚马逊AWS或阿里云等公有云服务优先
  2. 熟悉Docker或其他虚拟化容器技术优先
  3. 熟悉Spark/MPI等计算系统优先
  4. 参与过开源项目优先
  5. 有github和技术博客展示自己以往技术沉淀者优先

前端工程师
我们希望你热衷于前端技术,对浏览器加载方式理解深刻,渴望实现多样流畅的用户体验,
工作职责:设计并开发web前端页面,完善报表展现、数据操作等功能,并能使用缓存和按需加载方式优化页面性能。
任职要求:
  1. 熟悉W3C标准,熟悉MVC模式
  2. 熟练掌握HTML/JavaScripts/CSS/jQuery等前端技术
  3. 对用户交互设计有自己的理解
  4. 良好的沟通能力和合作精神
  5. 熟练使用git工具进行代码管理,熟悉基本的软件工程方法论和工具,例如单元测试、版本管理、Bug管理等
其他:
  1. 熟悉主流Web框架优先
  2. 有数据可视化经验优先
  3. 参与过开源项目优先
  4. 有github和技术博客展示自己以往技术沉淀者优先

后端系统工程师
我们希望你对业务系统开发有丰富经验,擅长设计简洁易用的RESTful API,热衷于提高系统性能和可扩展性。
工作职责:开发后端服务,包括权限控制、元数据管理、任务调度等功能
任职要求:
  1. 熟悉Python/Java编程
  2. 熟悉MongoDB,Redis,memcached等存储技术
  3. 对后端业务流程搭建有丰富经验
  4. 了解Nginx配置,使用过主流Web开发框架
  5. 熟练使用git工具进行代码管理,熟悉基本软件工程方法论和工具,例如单元测试、版本管理、Bug管理等
  6. 良好的沟通能力和团队合作精神
  其他:
  1. 了解亚马逊AWS或阿里云等公有云服务者优先
  2. 有Hadoop开发经验者优先
  3. 参与过开源项目优先
  4. 有github和技术博客展示自己以往技术沉淀者优先

数据工程师
我们希望你热爱数据和算法,熟悉计算任务的开发和调度过程,对分布式数据存储和计算流程的优化实现有自己的心得。
工作职责:开发ETL过程,优化存储方案,设计并实现分布式计算任务,搭建数据处理流程。
要求:
  1. 熟练掌握Java/Python/C++至少一门编程语言
  2. 熟悉Shell Script和Linux操作
  3. 熟悉常用数据结构和算法实现
  4. 了解分布式系统构成,有Hadoop开发经验
  5. 优秀的沟通能力和合作精神
其他
  1. 有生物信息学/机器学习背景优先
  2. 有Spark/MPI等计算系统开发经验优先
  3. 参与过开源项目优先
  4. 有github和技术博客展示自己以往技术沉淀者优先

我们提供:
  1. 有竞争力的薪资和员工福利
  2. 员工期权激励
  3. 宽松自由的工作环境、工作午餐和无限零食

感兴趣请尽快发简历到 igenedock@gmail.com ,如果有个人作品和项目,也可以一并附上。

2014新年快乐

  新年快乐,万事如意!

  2013年一共发表了32篇BLOG,比往年平均值要少很多,10月份以后因为忙ODPS对外开放的事情,更新频率更下降了。但我会继续写下去,还会写很多年。感谢您对这个BLOG的关注。

  单细胞动物,又很懒,没法多线程。关注这BLOG稍久一点的同学,大概会知道我总习惯在一月份定些重点,之后一年里如果遇到冲突纠结,就力保这两三个主要目标,其他一律让路。这种做法是从2006年开始的:软件、论文、专利、买房、买车、求婚、生娃、跳槽、旅游……运气好的一年,定了4项大事,忙到年底累得臭死,居然都能搞定;也有瓶颈年头,只定1个目标,年底仍然有遗憾。但总体而言,集中精力是个好习惯,受益匪浅。

  回去翻了翻BLOG,2012年有3个目标,年底感觉其中工作方面的目标没达标。于是2013年继续,而且只定了这一个目标:成为合格的产品经理,给ODPS留下独特贡献。

  一年下来,在ODPS团队里帮了些忙,仍然称不上“独特贡献”。所以2014年还得继续盯住这个目标。不过我快沾到边了。等ODPS对外开放一期、二期、三期的事都妥帖了,修炼可算小成。

  最近两个月为工作焦头烂额,家人说我:“念念叨叨总是你的ODPS对外开放,其他事完全不关心。”我的确像是有点魔障了。但这事真的很重要。感谢老婆、老妈和刚会说话的女儿,家里这三个女人都比我聪明、体贴、淡定和坚韧。

  除了眼前的具体目标,我希望在2014年能有更多勇气面对理想。回去看2006年初次盘点年度目标的BLOG,写了这么一段:"本科听老罗的课:'年纪大一点以后,最难的就是保持强悍,仍然敢把理想挂在嘴边'。没真正理解,或者说不够老,还没资格发表观点。"8年过去,三十多岁的大叔了,是证明所谓“强悍”的时候了。

Page One书店和格雷厄姆·格林

  总算到周末了,睡得不醒人事。周六一直睡到早上10点,创了今年的记录。

  起来以后开车带一家人出去玩。上一篇BLOG刚抱怨望京附近找不到好书店,今天在颐堤港看到一家Page One很不错。环境、服务、选书都很有品位。以后可以多带女儿去逛。

IMG_Ali_00179

  买了格雷厄姆·格林的《权力与荣耀》,村上春树的《碎片,令人怀念的1980年代》,北岛的《蓝房子》

权力与荣耀  碎片,令人怀念的1980年代  蓝房子

  格雷厄姆·格林的书都比较压抑,不适合心情不好的时候看。不过他本人很有趣。他同时又是正牌的英国军情六处间谍。还曾经在非洲当过著名双重间谍金·菲尔比的下属。格雷厄姆晚年的作品《尼斯的黑暗面》揭露了尼斯市的腐败,因此惹上官司并败诉,最终抑郁而死。在他死后三年,尼斯市雅克·梅德桑前市长因腐败和其他罪名被逮捕。

  至于为什么格雷厄姆·格林被提名了那么多次诺贝尔文学奖,却始终未曾获奖?,我在知乎上看到这么一段有趣的回答

  格雷厄姆·格林为什么拿不到诺贝尔文学奖,可以分两个阶段看:1968年前和1968年后。

  1968年前他被提名过几次,但都没有拿到,原因不外乎几种:他过于流行招致偏见、当年有和他同样够格的人选,或者运气不佳。比如1967年,格林和奥登竟然齐齐输给危地马拉的阿斯图里亚斯,奥登难道不够格么,而且他更穷,又去找谁哭?

  1968年之后,人为因素多一点,这一年Artur Lundkvist当选瑞典学院院士,他是著名的格林黑,以及天主教黑,我们知道格林是天主教徒……

  他说,格林那么畅销,奖金给他没意义。他还说,格林要想拿奖,除非从他尸体上跨过去。

  前面那句话有记录,后面那句话是别人爆料的,半信半疑吧。

  不过他的确在和格林拼寿命。格林是1991年4月去世,Lundkvist熬到了当年的12月才去世,真是在用生命捍卫偏见啊!

  Artur Lundkvist还喷过威廉·戈尔丁,喷过亚洲文学。在文学问题上,本来就不存在绝对的不偏不倚,每个人都有自己的偏见。

ODPS团队在招人:阿里大脑-智能数据平台项目

  ODPS团队在招人,我们要做一件大事:阿里大脑-智能数据平台项目,下面是项目和职位介绍。大家给我的微博 @还是地雷 私信联系。

  随着PC和移动互联网成为人们的生活方式,搜索、推荐、广告、和社交网络正在迅速融合,新的商业模式层出不穷,数据和流量已出现超过人们想像地爆发增长,我们已经彻底告别数据不足的时代;随着大型分布式数据处理平台在规模、可用性、和安全领域的技术突破,存储和处理数据的技术已不再是主要瓶颈;在阿里巴巴我们已经面对数据规模超出人类理解极限的局面,我们相信未来一定要依靠更有智能的平台才能理解和利用如此海量海量的数据,我们相信数据是最有价值的资产,未来商业数据的管理和利用一定会出现像今天的银行一样的模式,有一种平台不仅为人们保管数据资产,还能够以类似投资的形式实现数据资产的保值和升值。这是一场影响和改变未来互联网商业模式的深刻变革,阿里数据平台作为阿里数据资产的主要经营者,肩负着推动这场变革的使命,阿里大脑-智能数据平台项目是这场变革的开始。

  这里有世界上最具价值的互联网商业数据,从每天上亿用户在淘宝上的浏览和购物行为,到支付宝的每一笔付款纪录,从商家所有的销售纪录,到快递送货到每个消费者的过程,从PC端到手机端,我们运营着一个每天增量上百TB,数据总量有几百PB的超大型数据仓库。如果你对使用机器学习和人工智能的方法深度挖掘海量数据的价值有兴趣,这里是你最好的选择。

  这里拥有世界级的大规模计算平台和数据平台技术,完全自主研发的飞天大型分布式系统和数据处理平台,多个5000台规模集群每天运行着大量生产任务,从大型互联网数仓到BI分析和决策支持,从信用评估到无担保贷款风险控制,从国内互联网最大的广告业务,到每天几十亿流量的搜索和推荐相关性分析,阿里数据平台为所有这些业务提供基础平台和核心算法。如果你对开发新一代分布式数据分析技术和机器学习算法有兴趣,这里是你最好的选择。

  这里有一批充满梦想又脚踏实地的天才工程师,在大规模分布式数据平台领域,我们用了5年的时间走过了业界领导者8-10年的技术发展历程,我们鼓励技术创新,我们支持改变世界的工程构想,我们推崇那些用天才的想法影响和改变中国互联网主流业务的工程师。如果你热爱代码又有难以抑制好奇心想了解机器里面的每一个细节,如果你是一个充满梦想又热衷动手实践的工程师,这里有一个硕大无比的复杂机器,等着你来优化、改进、甚至重新设计。

  阿里大脑-智能数据平台项目正在打造一个拥有10万台服务器规模的智能数据平台,通过大规模分布式计算、Deep Learning等先进机器学习算法、和云计算开放平台等技术,理解和挖掘海量数据中的商业价值,通过精准营销和全面个性化,服务广大中小互联网企业。阿里大脑项目期待你的加入!

  我们不能承诺这里有世界上最丰厚的收入,我们不能承诺这里不用加班有完美的工作生活平衡,我们不能承诺这里能够实现一个企业家的辉煌与荣耀,我们唯一能够承诺的是:在这里你能够实现你一生最辉煌的技术成就!这里是培养像Jeff Dean和Sanjay Ghemawat这样伟大工程师的摇篮,对这点我们充满信心!

分布式系统研发工程师
  1. 拥有C++大型系统开发经验
  2. 在以下领域之一有大型生产系统研发经验
    - 大型分布式系统开发
    - 大流量和高性能在线服务设计和性能调优领域有实践经验
    - 大型搜索相关性、广告投放、推荐引擎的研发
  3. 在大型线上系统的部署、诊断(Debug)、和算法优化等方面有实际工程经验
  4. 在Linux kernel和网络领域有实践经验的候选人优先考虑

分布式机器学习算法工程师
  1. 拥有C++大型系统开发经验
  2. 在以下领域之一有大型生产系统研发经验
    - 机器学习算法的实现
    - 图像处理和语音识别算法设计和引擎实现
    - 大型搜索相关性、广告投放、推荐引擎的研发
  3. 在大型线上系统的部署、诊断(Debug)、和算法优化等方面有实际工程经验
  4. 在大规模Deep Learning模型训练领域有经验的候选人优先考虑

  大家给我的微博 @还是地雷 私信联系,或者把简历发到:“leheng 点 wang 爱特 alibaba-inc 点 com”。

周末ADC见!

  这周末的阿里技术嘉年华,貌似很多老朋友都会参加。14日“大数据技术与应用-A”的Workshop,我是现场主持人,欢迎大家来聊天。

  我们在招人,alidata算法团队为缺人痛苦,北京杭州两边都是,有数学背景又喜欢写分布式程序的同学,赶快找我帮你内部推荐!

workshop

的确是被黑了,请亲友们注意安全

  上次BLOG提到,怀疑自己被黑了。最近一直在查这件事。

  今天收集到一些信息,请公司里的安全高手帮忙看了看。(上一篇BLOG其实是我做的实验)。确认的确是被黑了。黑客还挺狡猾,在程序里设置了判断,从Cookies发现是我本人在访问这个网站,则一切显示正常,否则就显示乱七八糟骗人的内容。

  我的各种密码也许已经泄漏,昨天发现有人在试验修改我工作帐号的设置。各位亲友如果对从我的网站、邮箱、旺旺、手机发出来的信息有疑惑,请及时和我本人联系。建议大家更换自己常用的重要上网密码。

  WUWU~,这个世界真不安全,我还是回火星吧。