2018年10月pFind组实现的新一代开放式搜索算法Open-pFind发表在Nature Biotechnology上。在知乎上看到hchi的一篇文字《十年磨一剑,Open-pFind是如何炼成的》。勾起好多回忆。推荐一下。
Category Archives: 链接收藏
Rudy Wang的博客
我们GeneDock的程序员Rudy Wang是个专注的家伙。喜欢跑步。这次北马成绩3小时30分。他有很多传奇经历,去过6次西藏,去过十几个国家,你们谁被当地匪徒用冲锋枪扫射过?他刚开了自己的BLOG,地址是 http://www.rudywang.com/ ,推荐大家订阅。
2013阿里大数据暑期学校开始报名了
自主研发的ODPS是阿里数据交换平台(DXP)的重要组成部分,支撑着阿里金融、淘宝指数、数据魔方等关键业务。
2013阿里大数据暑期学校的主题正是ODPS。我们将从ODPS底层的飞天大规模分布式系统讲起,为同学们分享研发ODPS平台的几项关键技术:平台框架和服务化、跨集群调度、Tunnel数据交换服务、BSP图编程模型、分布式SQL引擎、分布式数据分析和数据挖掘算法。授课的主讲人基本上都是ODPS开发团队一线的技术经理,并邀请了清华大学、中国科学院、浙江大学等知名高校的专家。欢迎相关专业的博、硕士研究生和高年级本科同学报名。名额有限,赶快点击http://102.alibaba.com/
这次课程中,《分布式大规模数据分析和数据挖掘算法》的主讲人是我们算法平台团队的大牛品数(杨旭);而杭州站特有的《海量数据下数据挖掘实战》的主讲人是我们最主要的客户晓风(朱洪波)。强烈推荐!
CCTV,妈咪喊你补考初中化学
悲剧的CCTV出了一个低级失误。
首先,昨天的《东方时空》节目里,指责果壳网造谣惑众,链接如下(兄弟们,可能需要截图存证,估计很快就会从CNTV网站删除了)。
仔细跑去一看,这是果壳网里,专门开玩笑挖苦所谓砖家的小组“geek笑点低”小组里的帖子,链接如下,原文见后。注意原文明显是个玩笑,CCTV伟大的记者和编辑们,居然不知道那二十多个化学名词(例如“一氧化二氢”)都是“水”的意思,最来劲的是他们请的那位清华大学化学教授,这是什么样神奇的砖家啊。
科学研究表明隔夜水中含有零醇、氧酚、羟基氢、氢羟酸、苛性氢、二零醚、正氧烷、氧乙烯、氢氧化氢、脱碳甲醛、一氧化二氢、氢化超氧酰、脱氰零醛肟、二聚氢氧酸酐、氢化脱磺硫酸、氧化脱羧乙酸、氢化脱苄苯甲醇等等化学物质,当你喝下隔夜水以后,这些化学物质会迅速的被你的消化系统吸收,进入血液循环到你身体的每一个角落,影响你几乎每一个生理反应。如果一次摄入过多,会导致你胃胀,恶心,呕吐,食欲不振。 |
最搞笑的是,电视节目里,有个长镜头显示了这个帖子的一个网友回复:“由于摄入一氧化二氢而死亡的话,主要是淹死吧!”。
今天一来,网上无数的帖子回复和微博转载都同情地说:“请不要嘲笑智力残障人士, 这是不对的!”。好吧,CCTV,妈咪喊你补考初中化学。
呼吁百姓“不信谣,不传谣”,可自己的专业操守如此儿戏,公信力如此薄弱,怎能怪人家不信你。
招聘、求职和早恋
前两天的千核测试太累,测试报告发出去,老婆大人命令在家休息了一天。
先帮朋友发个招聘广告。香港某大学正在筹备的文本挖掘和推荐算法实验室,招聘熟悉学术圈氛围,有软件工程经验,能带人做产品的工程师。这个实验室是与企业合办的,其目标是把学术研究成果向市场孵化。实验室负责人是从pFind组出去的帅哥leo。待遇不错,尤其是与国内相比。如果嫌香港租房比较贵,可以在深圳住。嗯,如果不是因为年纪太大,在北京成了家,俺是一定投奔的。有兴趣的同志们赶紧发简历到topmathchina at gmail。要快哦,亲。
言归正传,最近招聘的话题在42qu和各个牛人的Blog上大热。例如刘未鹏刚发表的Blog《怎样花两年时间去面试一个人》 ,堪称经典。作为资深人贩子,我以前也在Blog上议论过别人的是非。类似的,挑灯看剑也在BLOG上叹息过豆瓣招人不易(这篇BLOG现在被隐藏了,如果你真想看,用Google Reader)。招人的机构找不到靠谱的人,大量求职的年轻人又在纠结郁闷,出现这种局面责任在教育机构。
反过来说,总有人能超出环境均值成为Outlier。前两天蓝色宝石聚会,rainbow学长愈发内敛强大,喜欢把他的经历讲给年轻人。rainbow刚来北京上大学时,特困生,家里为了凑足学费历尽周章,去中关村软件公司打工,开电脑的电源按钮都找不到……可一年以后,他给家里汇回去1万元,蓝色宝石筹备创业时,他说没问题,现在的积蓄够自己两年的生活;到了毕业,打印出来的求职简历比别人厚四五倍;进入老牌国企,很快成为几十年来最年轻的处长;他在北京买了房子,把父母接来,结了婚……最关键的是,每次见到我们这些朋友,他还是那个真诚、温和、质朴、大度、勤奋、踏实的rainbow始终没变。无论提供的教育质量怎样,毕竟是大学,有很大的自我发展空间,年轻人首先应该有自己的行动。
关于大学教育和创业,42区上有个16岁小朋友前两天发帖子“为什么我选择辍学创业?”。对这件事,每个人有自己的看法。求职和找对象一样,想找到可以托付的事和人,先得做不少功课。说到这里,跑个题,有个15岁小女孩误入邪恶的42qu,问:“我这个年纪、要是喜欢上了别人该怎么办”,joyfire大叔是这么教坏小朋友的。
早恋挺好,早点体会一些悲欢,了解人生的真相。总比变成剩女了还不了解异性的基本特质好(北京城里这种女孩还真多,周围认识好多有车有房却没谈过恋爱的30岁白骨精)。
不过,要把握几点原则: 1、保持悲观,概率统计显示,中国大约有3000-5000人是非常适合你的The one,这个人在中学就出现的概率比被雷劈中的概率小一千倍以上。 2、相信自我感觉,保持勇气。勇气有很多种,例如向一个人早点承认自己不喜欢他,让彼此尽快解脱的勇气。 3、学会自我保护。世界上真的有不少烂人,得不到就伤害。保持冷静而强悍,不要轻信,学一点跆拳道。 |
软件工程的经验教训
很早起来开车送家人去医院看病。到单位的时候,牙齿还在打战,北京的天气凉下来了。这周安排和zk一起双人编程,他还没到,我先上来看看Google Reader写点BLOG。
作为所里的内部培训师,我常被各个中心和课题组请去分享软件工程的经验。这是上周刚做完的一次报告的ppt。我会不断更新内容,感兴趣的同志可以隔三差五地关注我的工作主页的Technical Reports栏,下载最新版。
收到越来越多的同事的邮件,和我讨论软件工程、系统架构和设计模式。作为国立学术研究机构,我们所处的环境的确不同于商业机构的软件研发团队。但从另一方面来说,总是有更多共性的问题在里面:如何挑选、培训和激励人才,如何做计划并执行……总可以做的更好,更有效率,更有成就感。
我PPT里没深入写PM自己的心态问题。这是最近两年切身体会到的一个重点。软件项目压力很大,极端情况下,甚至会造成心理伤害。优秀的PM必须有器量和涵养,懂得欣赏优点,愿意信任同伴,既有发自内心的称赞,也有就事论事的提醒,还有开诚布公的道歉,在团队里营造出和谐的气氛来。如果碰到一个鸡贼刻薄的PM,大家心里充满恐惧和抱怨,就会只顾着关注PM想什么,逐渐丧失专业人士的主动性和独立见解。更深入点来说,是否愿意信任他人,也许正反映了PM本人内心深处的安全感。态度决定命运,对周围世界的基本看法,会决定一个人能否得到同事的尊重和喜爱。我最后悔的、常常反省的事,就是有几次在种种压力下冲别人吼,这往往有很大的负面影响。当然,人不是机器,情绪都是波动的,需要恰当的释放,也需要逐渐成熟。总之,PM要提高自我修养,防止负面情绪泄漏给无辜的同伴。
刚好前两天网上到处都是创新工厂的那副“PM跪求研发”的图片,PM的心态好一点,项目就会顺利很多。zk来了,下次再聊。
《The Stuff of Life》中文版即将出版
《The Stuff of Life》中文版(名为《漫画生命史话》)正在印刷,即将出版。有兴趣的朋友们可以给我捧捧场。
09年秋天,刘未鹏(pongba) 刚到北京,TopLanguage组织了几次聚会(在那几次聚会的过程中,目睹了尚在豆瓣的张教主辞职去了美空,没多久又出来创业;还和Tinyfool一起去吃韩国烤肉)。其中一次就在图灵出版社里,我和hchi哥去参加。我无意中翻到了《The Stuff of Life》的英文原版,发现这是一本很有趣的科普漫画,与高中时代令人生畏的生物课完全不同。图灵编辑们说,唤起兴趣大于灌输知识,国内市场这种好书太少了。无知者无畏,我就接下了翻译任务。
诚恳而言,作为非生物科班出身的我,翻译书中的生物学专业内容遇到不少困难,初稿很不令人满意。多亏图灵编辑们没放弃,又找到了火力支援,重新进行翻译和整理,本书才有机会和中国读者们见面。
由于水平有限,译稿有诸多遗憾之处,无法100%把英文版里俏皮轻松的风格呈现出来,这些不足的责任都归于我。欢迎大家给出意见建议,我会在这个BLOG上长期维护一个勘误表。
2010年BLOG列表
- joyfire的博客从spaces live搬到这里
- pFind Studio 2.6发布
- 欢迎贡献自己PC空余时间,帮助CAS@home计划
- 创业者加油!
- SD2.0和中国Cocoa移动开发者大会
- 列书单.2010.12.8
- 去上海参加“软件开发2.0大会”
- 生物信息和云
- 42区、话剧和书单
- 控制思想
- pFind引擎的第四代索引模块
- 计算蛋白质组学研讨会和大S结婚
- 即将到来的pFind Studio 2.4.2版,还有CNCP2010大会
- 流水帐.2010.10.4
- 零零碎碎
- 专利、商标和比比西T恤
- 竖起耳朵听
- 话剧和哀悼
- Sector&Sphere
- 列书单.2010.7.29
- pFind新版、生日
- 美国能源部长在Nature上发表的学术论文
- 终于买到了《独唱团》
- 章文嵩的技术报告
- 列书单.2010.7.1
- 马尔代夫
- 断网断电话一段时间,还有pFind的千核并行进展
- 我在kanrss上的帐号是@joyfire
- 我结婚了
- 列书单.2010.5.28
- pFind集群的论文正式发表
- 回到北京了,上来敲几句闲话
- 丽江流水帐
- pFind Studio 2.4开始下载了!
- 头晕和踢踏舞
- 流水2010.05.05
- 这帮悲剧的RCM编辑
- 朝圣大会里的中国
- Beta技术沙龙:Go语言
- 列书单.20100421
- Ru27机器人穿越大西洋
- 笨功夫和气场
- pFind并行版论文接收了!
- 刺猬的两个偶像
- 容错、书单、pFind和pNovo的国际初show
- CUDA、婚礼和历史
- 论文最终稿submit了!
- pFind引擎内核建立Trace机制
- 拿着马桶搋子的疯狂兔子
- toy61.com购物体验
- 开始工作了
- 求婚什么样?
- 放花炮
- 过年的娱乐
- 中国队赢了,以及Google“巴子”
- 最近《李献计历险记》很火
- 去Intel测试、下一版的昵称
- hchi哥要请客
- 列书单,《阿凡达》技术
- 谷姐为和平而生
- 醒过来了
- 云海和《青衣张火丁》
- 原来生物的遗传密码表有不止一套呀
- 记录一下
- leo和hchi的倒排索引的文章被接收了!
- 1月5日
- 暴雪和张小盒话剧
2009年BLOG列表
- 这一期小姬看片会很好玩
- 2012和韩寒
- 里程碑收尾,论文,雪季开始,理想主义和Hadoop的调度算法
- 流水帐.2009.12.14
- 流体力学和干妹妹
- 多背一公斤和showstopper
- 友情宣传stdyun.com
- 参加Beta技术沙龙,主题是推荐系统
- 生日和数学
- Hadoop in China 2009印象
- 列书单.2009.11.13
- 流水帐.2009.11.11
- 织田信长的第17代后裔
- 天河1号抢在了曙光6000的前头
- 海明威的巴黎时代
- 流水帐.2009.10.18
- 网络游戏就是云计算
- 狗血时代、百年老店和Objective-C
- 你适合当Web设计师吗
- 推荐10月份的《程序员》
- 流水2009.10.4
- 中国万网有安全问题
- 五星级秘书和职业理想
- Joel 12条和2006年
- 999新人、哲学家就餐和lehuo域名
- 列书单.2009.9.6
- 用户易用性就是容忍犯错和偷懒
- 论文和《周礼》
- 参加Open Party归来
- 六度
- 球迷
- Beta技术沙龙:利用SNMP进行服务监控
- 推荐Resys Group
- 休假状态,补列书单
- 学术交流和流星雨
- pFind Studio 2.3 RC
- 老妈的电话
- 推荐《我想吃一个小孩》
- 挺龙芯
- pFind并行版定型
- 列书单.2009.06.09
- 贝塔技术沙龙:iPhone开发
- IP、IC、IQ卡,通通告诉我密码
- TL聚会,遭遇若干大牛
- 五一比赛日,五二堵车日,还有书单
- MYSQL最终还是落在Oracle这个流氓大亨手里
- 2009.04.23列书单
- 基于云计算的蛋白质组学
- 植树归来
- 列书单.2009.4.7
- 有什么办法可以让一只老鼠变得抑郁?
- 4月1日节日快乐!
- 邵小毛
- 列书单.2009.03.27
- 《仙剑奇侠传 四》终于打完了
- 今天地铁上遇到的一家美国人
- 重读Google老三篇
- 心理学和巴菲特传记
- 推荐《亲爱的安德烈》
- 本届奥斯卡最佳动画短片
- Sergey Brin当选美国工程院院士
- iPhone上的Google语音搜索
- 重构和元宵节孔明灯
- 《The Producer》
- 上班第一天,列书单
- 别冲着硬盘大喊大叫
- 刚刚燃放的礼花
- webgame和年货
- 张火丁的《锁麟囊》
- 卫星照片上的就职典礼
- 列书单.2009.01.20
- 豆瓣新九点、pFind小品和团队氛围
- 《高卢战记》和《内战记》读书笔记
2008年BLOG列表
- 计算机、围棋和有鬼气的好诗
- 列书单2008.12.28
- 再见上海
- 本篇与技术无关
- 编译加速、分布式版本管理和IE7漏洞
- 不是天才,就是笨蛋
- 中场休息
- 谁是技术先锋?
- Python 3.0 final release和找工作
- 大嘴
- 昵称
- 大机器、游戏和艾滋病
- 电子竞技、周扒皮和工程师性格
- 想买lehuo域名的朋友,抱歉
- 怎么学计算机
- 技术报告:pFind研发中的工程问题
- 蓝色宝石俱乐部聚会归来
- 美国程序员和政治
- pFind 2.2 Alpha 1诞生
- 《寻羊冒险记》和C++0x
- AKA Linux内核开发者大会和pFind Team
- 《史记》里的巴菲特
- 软件中的隐喻(Metaphors)
- 论文的Comment和程序员的艺术细胞
- joyfire.net临时指向博客这里
- 列书单.2008.10.5
- Apple是个Great的公司吗?
- 老妈和老舅
- 新人培训和并行模式
- 要回北京了
- 标准和政治
- 里程碑
- 闭幕式和年度目标
- 上海书城归来
- 杭州一日
- C++0x、Python3.0、《The Beatles 1》和《再袭面包店》
- 列书单.2008.08.28
- 培训中
- 足球决赛是阿根廷对尼日利亚
- 去看杨威的男子全能
- 昨天去看击剑
- 近在咫尺
- 《长征记》偷窃和苏格拉底
- Randy Pausch去世了
- 关于异常机制和编程style
- 2006年圣诞节在星巴克唱歌的一家人要回国了
- 推荐一下“豆氏”的BLOG
- 我的奥运门票
- C++0x能不能在09年发布?
- 发布pFind 2.1 Beta 2
- 停BLOG14天
- 《一把雨伞给这天用》和《沉思录》
- J.K. Rowling在哈佛大学的讲演
- FF3下载日
- 生物信息和创业
- 关于卡夫卡
- 华盛顿纪念塔上的清朝宁波知府题字
- 新闻批注
- 《三体II:黑暗森林》
- web2py和uliweb
- 著名书店和《九故事》
- Google App Engine开放了
- 《布鲁克林的荒唐事》和《费城风云》
- 哈利·波特
- 准备拽着2.1怪兽出去吓人
- 希望震区平安
- 刚刚发生了地震
- 冰激淋和B/S结构
- Google App Engine视频
- 出色的软件工程师什么样?
- 贴照片,列书单
- 验收通过
- MYSQL和鲨鱼
- pFind 2.0历程
- An Inconvenient Truth值得推荐
- 严谨和乐天
- pFind 2.0最后定版
- 数学家和生物学家
- 昵称征集
- 《塔西佗编年史》和《偷书贼》
- 火炬
- 第一个milestone
- pFind新版开发启动
- 零散流水
- 何必乱翻书
- 关于C++的ABI
- 2008.3.20列书单
- 说说《开卷八分钟》
- 2008.3.12列书单
- 《毕业生》和《阿甘正传》
- 江山代有人才出,各领风骚没几年
- 面试和激情
- Mondrian视频
- 列书单.2008.2.22
- 返璞归真
- 混合编程的前世今生
- 程序员日快乐,哈哈
- Tango Tina文档翻译完了
- 2007年图灵奖颁发给Edmund M. Clarke,Allen Emerson和Joseph Sifakis
- Google Tech上关于Python 3000的讲座
- 朱德庸的漫画:大家都有病
- 上海大雪&杂录
- 到上海出差
- Google研发经理的职位要求
- BG的最后一个工作日
- 网络随着我们变
- 贺仲雄老师走了
- gmail广告