Tag Archives: 高频交易

数据挖掘,微博,股票,星座和新年假期

  SNS数据挖据热度持续不降。

  前一阵数托邦工作室(DATATOPIA)利用微博数据进行数据挖据,发表了这篇关于《小时代》观众人群的分析报告,获得了很大的反响。根据数据比较,《小时代》观众的平均年龄非常低,很大比例来自二线城市,很大比例是女性,很大比例用iphone,很大比例喜欢《快乐大本营》。网上很多批评《小时代》的北上广大叔未必真正了解这群消费者。我在淘宝指数和百度指数上验证了一下,和文中的统计结论差不多。

  上个月奥巴马被刺杀的假新闻引发股灾,也是由于数据挖掘自动触发导致的。越来越多的投资公司实时监控社交媒体用于股票量化交易(据研究,Twitter情绪和股票走势之间有7分钟的提前量)。前一阵光大银行的投资事故占满报纸头版。这两天纳斯达克系统又崩溃了,最近这一两年事故真多,都是高频交易惹的祸。再加上“互联网金融”让传统银行和基金坐立不安。互联网屌丝正在颠覆金融高帅富。

  说到数据分析,《福布斯》杂志总结了Top 500的亿万富豪,发现处女座最多。被大黑特黑的处女座们一片欢呼!较真一点的话,子柳在知乎上的一个回答中提到,关于星座倾向性,必达团队曾严肃分析过淘宝消费数据,结论是“出生月份与行为模式无关”。由子柳的解释可以大概猜测到,中国的富翁中可能是天蝎座较多。中西方差异源于圣诞和春节之间的时间差,你懂的。

金融基础

  因为ODPS业务需要,开始有意识搜索阅读金融方面的文字。除了上次写到的金融做空,看得比较多的是以下两个领域:

  首先是搞清创投领域的基本概念,例如投资前估值(pre-money valuation)、普通股(equity)、普通债(bond)、可转换优先股(convertible bond)、清算优先权(liquidation preference)、反稀释条款(anti-dilution provision)、董事会条款(board provision)、保护性条款(protective provisions)、期权池(option pools)、股份回购(share repurchase)、对赌协议(valuation adjustment mechanism)、毒丸(poison pill)和绿鞋(green shoe option)等

  其次是了解金融工程师的常见工作,例如风险管理(risk management)、建模(factor model)、结构产品定价(structure product)、宏观模型(macro economics)、市场微结构(market micro structure)、高频交易(high frequency trading)和统计套利(stats arbitrage)等

  原本想把这些概念的具体解释都贴在BLOG上,又感觉意义不太大。有兴趣的自己Goolge很容易找到专业简洁的解释,尤其是在英文维基百科上。周五羲和团队一起看了一部老电影叫Good Will Hunting,里面有句经典台词:“你花一万五所受的教育,用一块五就能在公共图书馆得到。”有了互联网,后半句应该变成:“免费就能在维基百科上得到。”

  像上次说的,从不买股票,也不打算跳槽当Quant。金融行业都是高智商高情商,像我这种晕晕乎乎的人闯进去,会死得很难看。嗯,另外我喜欢穿T恤