2016大数据时代下的量化投资

发布时间:2016-01-18 作者: 微量网 来源:微量网 阅读数量:

  大数据是一个最近非常流行的词汇,但大数据是什么?他与传统的统计学有什么不同?大数据应用于量化投资的哪些方面?本文将结合大数据的特点,对大数据在量化投资中的应用作深入分析。

量化投资

  根据《大数据时代:生活、工作与思维的大变革》的定义,大数据具有以下三大特点:

  1) 不仅利用随机样本,同时也利用全样本数据

  传统的统计学分析问题时,由于技术局限,通常不可能获取全样本数据。例如,在调查全国人口平均身高时,通常无法获取所有公民的数据,而只能通过抽样的方式获取部分身高样本,希望样本能够代表全体。而大数据则频繁利用全样本数据,这在量化研究中特别突出。量化研究所采用的数据主要包括行情数据+财务数据。行情数据是在交易所发生的每一笔交易,是全样本数据;财务数据则是所有上市公司被要求强制披露的数据,也是全样本数据;这些数据都可以方便的从任何金融数据终端中获取。

  2) 利用多维数据,不仅是精确数据,也包括不精确的数据

  大数据的另一个层面是利用多维数据分析问题,例如,在预测投资组合的收益时,除了用到上述的行情数据+财务数据,还会用到宏观数据(GDP,PMI等),新闻信息,股吧社交热度信息等其他维度的数据。除了行情数据是精确数据外,上述其他均为不精确数据。但不精确的数据,并不是没用的数据,正如《大数据时代》所说,“大数据基础上的简单算法比小数据基础上的复杂算法更加有效”,翻译成量化语言即为,利用包含了不精确信息的多维数据的简单选股策略,比只用单维度精确数据(例如仅用价格和成交量)的复杂策略将更加有效。

  3) 不仅利用因果关系,同时也利用相关关系

  严格来讲,传统的统计学也利用相关关系。虽然大数据并不一定意味着数据量大,但通常,全样本数据&不精确数据往往意味着数据量的提升,而数据量的提升会导致从数据中提炼的相关关系更加可信和稳定。例如沃尔玛公司发现:每当飓风来临时,蛋挞的销量也会增加。采用过去几年计算机自动记录的两者数据得出的这种相关关系,是否比仅用几个服务员在几天内手工获取的抽样数据更可信?但在量化交易中,光有相关关系是不够的。例如,观察到每周四大盘平均涨跌幅比其他几天低,是一种相关关系。但利用这种相关关系,还不足以形成一个稳定的交易策略,因为你并不知道因果关系是不是真的存在,或者仅仅是数据挖掘的结果。因此,利用大数据得到更稳定的相关关系只是一种中间过程,最终目标是使在寻找因果关系的过程中变得更有数据基础。

相关文章   More

热门新闻   More

推荐产品   More

文武财神-中证500 微量网

当月收益率

134.94%

实盘收益率

33.22%

购买

盗梦空间_IF 微量网

当月收益率

16.35%

实盘收益率

193.09%

购买

龙城飞将(4分钟) 微量网

当月收益率

21.73%

实盘收益率

193.09%

购买

期货策略推荐   More