Tag Archives: 晓风

把事做成

  前一阵参与组织阿里巴巴大数据暑期学校,自然会和参加的同学们聊起求职。我发现90%的同学都希望进数据建模团队,而不是数仓团队或分布式平台开发团队。我猜很多同学没踅摸过职业成长,仅仅因为数据分析师高端大气上档次,而程序员听起来很屌丝。

school
阿里大数据暑期学校,晓风正在和同学们讨论PCA和SVD算法

  怎么说呢,BI团队当然个个都是精英,但并不像很多同学想的那样高帅富:数据分析师负责阳春白雪的统计机器学习,剩下的编程、调BUG、看机器这种粗活自有旁人打理。事实上,无论哪个团队都没有“旁人”跑龙套擦屁股,你得挽起袖子把一件事从头做到尾,十八般武艺样样皆通。举几个我们阿里数据平台部门的几个人当例子:

  数据挖掘团队的晓风,数学功底当然不用多说,然而他也是一个C++和分布式编程老手,从当年的ACE、ICE、DCOM到现在的Hama、GraphLab都会。

  基础数据团队的市丸,数据仓库那些生产业务当然不在话下,同时他也用MR和BSP编程模型开发了不少能处理上亿行的数据样本的大规模分布式算法,例如SVD和Pagerank。

  产品团队老大玄澄,麾下一群古灵精怪的美女PD,做出淘宝指数、数据魔方、淘宝时光机、淘宝日历APP……他整天玩乐高玩具,体验各种新鲜玩意儿(例如基因测序),办公区供着乔布斯牌位,踅摸用户体验创新……其实,人家是北大数学系的。

  至于俺们ODPS团队,很多人也都是十项全能,我就不自吹自擂了。

  就我的经验,对个人成长最有帮助的职位,往往正是那些最苦逼的、点灯熬油、枯燥容易出错的活儿。例如我们这里专门负责半夜值班盯住数据生产基线的batman团队,那可不是随便什么新兵蛋子就能混进去的。报名上百人,只选了十几个,都是各团队最牛最靠谱的业务骨干,这些人正是公司的重点栽培对象。上次去杭州出差,我特意混进去和蝙蝠侠团队一起值了一次夜班,一晚上的收获比正常情况下几周都多。

batman
传说中的蝙蝠侠团队

  主动扎到最复杂的、接触全局的业务里去,耐心一点,挽起袖子做好水面以下的力气活,为团队提供独特贡献,把事做成。这才是最快的成功路径。想加入互联网公司的年轻人一定要弄清楚,这个行业的业务核心就是编程,你首先必须是个合格的程序员,再谈其他。这就和空军里没有开过飞机的人没资格升师长、海军里没在甲板上起降过飞机的人没资格升航母舰长一个道理。

  最后打广告,阿里数据缺人。数据分析师,数仓工程师,算法开发工程师,分布式平台开发工程师,测试和配置管理……欢迎找我内推。