寻找牛股

我们一直在努力

如何挖掘数据?

日期: 来源:爱扒股

西蒙斯的成功之处在于:他有一个精通数据挖掘技术的团队。在市场无效率的地方进行数据挖掘,不仅能够针对高频数据或低频数据,而且也能够针对成熟市场或者新兴市场。西蒙斯的长处就是掌握了观察市场的正确方法。市场并非处处是有效的。市场是否有效则是市场参与者竞争的结果。市场参与者的行为是具有偏差的,个体的偏差有的时候会造成集体的偏差,这种偏差进而产生套利机会。而高频金融数据就是提供了观察这些偏差与市场的机会。

那么,什么是高频数据?

20世纪90年代以前,大家对金融时间序列的研究都是针对日、周、月、季度和年度数据进行的,这种金融数据在金融计量学研究领域往往称为低频数据。


最近以来,随着计算工具以及计算方法的发展,大大地减少了数据记录和存储的成本,从而对更高频率的金融数据进行研究成为可能。

在金融市场当中,高频率采集的数据可分为:高频数据(high frequency data)和超高频数据(ultra high frequency data)这两大类。

(1)高频数据。高频数据指的是以小时、分钟以及秒为采集频率的数据。高颇数据实际上就是日内数锯,指的是在开盘时间和收盘时间之间进行抽样的交易数据,主要基于以小时、分钟甚至秒为抽样频率的、按照时间顺序排列的时间序列。

(2)超高频数据。超高频数据指的是交易过程中实时采集的数据。

高频数据与超高频数据之间有最大的差异,主要的差异在于:高频数据是等时间间隔的,超高频数据的时间间隔是时变的。

通常来说,金融市场上的信息会对证券市场价格运动产生连续的影响。数据的离散采集一定会导致信息不同程度的缺失。采集数据频率越高,信息丢失越少;相反地,信息丢失越多。

从大数据和数据的角度来说,金融市场主要是两种数据:结构性的数据和非结构性的数据。结构性的数据比较好理解,比如你在市场上购买黄瓜.黄瓜定价为1元钱,或者2元钱,这个“1”或者“2"为一个结构性的数据。假设你买入一只股票,这个股票是9元钱一股,或者24元钱一股,这个是结构性数据。

因此。从这个角度来讲,最近几年以来随着收集数据能力的进步,比如人们通常所讲的高频数据。过去大家能看到的是一天的数据,比如第一天的A价为多少,第二天的A价为多少,或是开盘价等,几个数据大家能够看到。当前你必须知道,大家现在所看的数据,每间隔可以达到为五秒,这个数据仅仅在一天里就是巨大的。随着科学信息技术的进步,可能大家比5秒以下单位的数据更容易涉及。将来对这种数据的运用,目前金融界都知道,对高频数据的运用和开发,大家已经认识到威力是非常大的,也能够带来巨大的投资收益。比如。西蒙斯所做高频收益的套利和做高频数据的配对交易等。他已经获得很好的收益。

西蒙斯偏好的是根据数据挖掘而制定交易策略。20世纪90年代中期,很多交易所开始提供高频金融数据。交易者在支付一定的费用之后,指令册数据以及订单流数据均可以得到。实际上,这就是金融市场微结构领域研究开始发展的时期。研究发现价格并非实时反映信息,信息融入价格必然要有一个过程。然而人们高频时间框架下对金融市场的运行规律并不太了解。实际上这个领域成了西蒙斯的蓝海。

大家推测,通过手下精通数据挖掘技术的团队。经过对指令册数据以订单流数据的大规模数据挖掘,西蒙斯在该领域中找出了许多成功的交易策略。只要有了备选交易策略集合,投资者就能够筛选出有效的交易策略。有效的交易策略可以在一定程度上对市场的将来行为进行准确预测。

数据挖掘通常的方法就是交叉验证,即把数据划分为建模样本与验证样本。有效的交易策略应当能够在建模样本和验证样本上体现出很好的预测效力。

对于高频数据而言。是因为数据量巨大,所以进行交叉验证非常容易。对于低频数据来说,通常需要在一套数据上进行模型的开发与验证。这便涉及数据窥探问题。

在一套数据上对大量的交易策略进行测试的时候,出于随机性不可避免会有某一些规则表现较好。比如,假如交易策略全体的分布服从正态分布,那么将会有5%的策略的绩效高于平均绩效1.65个标准差,有1%的策略的绩效比平均绩效2.33个标准差要高,等等。如果投资者认为绩效高于平均缔效2.33个标准差的策略就是有预测力的策略(优异策略)。若测试1000条策略,尽管出于随机性也会有10条规则会被当成优异策略。之所以会产生这种情况,是由于共用一套数据检验的时候,除第一条策略以外的策略“窥探”了数据导致的。有两个很有名的统计检验能够用来控制数据窥探偏差:真实性检验(White, 2000)以及优异预测能力检验(Hanson, 2005)。这两个检验的最重要思想是,假如一个交易策略集合中的最优规则是真正有预测能力的,那么它的回报一定要比随机情况下该策略集合可能带来的最大回报来得大。至于控制数据窥探偏差的重要性,西蒙斯的团队有可能运用了上面所说检验及其替代方法。

聚合标签

早盘选股涨停板上市公司龙虎榜热点题材股市炼金术股市名家股票新闻股票学堂 涨停股预测股票涨跌停板涨停板买入法涨停板卖出法涨停十五招追涨停板技巧如何抓涨停伏击涨停战法伏击涨停十八法发现涨停的60个细节涨停板如何赚钱涨停绝杀九招如何选择涨停股捕捉连续个股涨停方法股市涨停密码图解股票涨停规律涨停10招七步分析法涨停板实战交易快速捕捉涨停股的技术要诀 李大霄最新股市评论冯矿伟新浪博客水皮股市最新言论严为民最新持股淘气天尊股市最新点评叶檀股市最新评论黄生看金融齐俊杰看财经巴菲特股票投资策略徐文明大盘点评蒋菲股市评论牛刀股市最新评论花荣股市最新观点杨德龙最新股市评论任泽平股市最新评论但斌最新持股洪榕股市最新消息金鼎论市徐小明股市点评荀玉根股市最新评论李立峰股市最新评论郭施亮股市最新观点黄智华股市最新评论钱启敏股市最新评论沙黾农股市最新评论展锋股市最新评论丁大卫新浪博客居锦斌新浪博客李正金新浪博客凯恩斯最新股市评论王亚伟持仓股票陈锐看盘叶荣添最新股市消息蔡钧毅最新股市消息魏宁海股市最新消息阿丁股市最新消息杨百万股海实战空空道人股市最新言论彼得林奇的成功投资wu2198股市即时分析索罗斯的金融逻辑钮文新股市最新言论时寒冰最新言论师晨冰推荐股票詹姆斯西蒙斯操盘术查理芒格的投资原则罗杰斯投资预言曹或均跟史玉柱学炒股段永平的80条炒股妙招格雷厄姆证券分析管清友新浪博客马红漫谈股市傅海棠傅海棠期货利弗莫尔操盘秘诀斯坦利克罗操盘术马光远最新谈楼市皮海洲谈股市石天方谈股市股市刀锋股市最新评论信哥实盘和众汇富安东尼波顿教你选股投资大师教你止损国际大师谈投资利维摩尔股票交易原则跟谢宏章学炒股普林格教你选股张中秦新浪博客水皮谈股市的规律李大霄投资战略约翰博格的投资智慧边风炜股评

热门文章

  • [涨停早知道]关键词:新基建、猪肉(2020/3/12)

  • 扒股君览宏观 ①国常会:抓紧出台普惠金融定向降准措施,额外加大对股份制银行降准力度。②两部门:支持建成一批年产值超过100亿元的优势特色产业集群。③发改委:进一步扩大鼓励外
  • [选股早知道]关键词:新基建、锂电池(2020/4/27)

  • 扒股君览宏观 ①央行、银保监会:统筹推进金融精准扶贫工作,落实好各项支持政策。②财政部、税务总局:普惠金融有关税收优惠政策实施期限延长四年。③农业农村部:立足抗灾夺丰收,
  • [选股早知道]关键词:锂电池、农业(2020/3/30)

  • 扒股君览宏观 ①国开行决定设立2500亿元专项贷款,加大对制造业支持力度,涉及集成电路、新能源汽车、5G与光通信、大飞机、新型显示等领域。②北向资金27日净流入34.14亿元。个
  • [涨停早知道]关键词:5G、滞涨(2020/3/9)

  • 扒股君览宏观 ①外汇局:1月银行结汇10067亿元人民币。②海关总署:中国1-2月贸易逆差70.9亿美元;预估顺差388.5亿美元。③工信部召开加快5G发展专题会。④交通部:将农民工返岗包
  • 【涨停预测】唐德影视等有望冲击涨停(名单)

  • 一、公告及信息 唐德影视:东阳市国有资产监督管理办公室将成为公司实控人 公司实控人吴宏亮与东阳市金融控股、东阳市金融控股的控股子公司东阳聚文影视文化投资签订了意

最新文章

  • [涨停早知道]关键词:检测、锂电池(2020/5/8)

  • 扒股君览宏观 ①今年在宏观政策方面因时因势还会推出新的举措,加大宏观政策调节力度。②财政部、国家知识产权局:扩大知识产权质押融资规模,推进知识产权证券化。③中证协:探索
  • 【涨停预测】华懋科技等有望冲击涨停(名单)

  • 一、公告及信息 华懋科技:公司控股权拟发生变更 股票复牌 公司控股股东金威国际与华为投资签署转让股份框架协议,交易完成后,华为投资将持有公司29.35%的股权并
  • 小北读财报:太棒了,扇贝听了都想鼓掌!

  • 小北读财报:太棒了,扇贝听了都想鼓掌!扇贝跑了不是一个故事,而是一部电视连续剧。这部剧的导演来自大连市长海县獐子镇沙包村,电视剧能拍成的前提是,獐子岛这样的企业
  • 索罗斯面临妻离友散的危机

  • 索罗斯忠告:“投机事业需要坚韧的神经,随时准备承受打击和痛苦。”“我和基金融为一体;它因我而生,我和它生活在一起,睡在一起......它是我的情妇。这是我与妻子
  • 索罗斯的投机哲学:为投机正名

  • 索罗斯忠告:“我是一个慈善的、哲学的、金融的推理者。” “我只能一而再地对盲目信任市场的魔力发出警告”,“市场中留有投机空间是各国政府的错误”。 “我一生中为了
  • 索罗斯反射理论:三人成虎

  • 索罗斯忠告:“经济学家对这个世界的运作方式欠缺实务上的理解。他们只管做伟大而不现实的梦,只谈理想情况,而且误以为这个世界很有理性。” “然而,流行偏见是市场走势
  • 索罗斯荣枯相生理论及实践

  • 索罗斯忠告:“对荣枯相生周期的清醒认识是评价投机环境和选择投机时机的大前提。” 简单地说,荣枯相生就是开始是自我推进,继而难以维持,最终物极必反。” “观念有缺
  • 帝国循环与广场协定

  • 索罗斯忠告:“一个自我推进的过程——然而它是不能持续的,最终会被颠倒过来。“广场饭店协定显示,汇率自由浮动制度已经走到尽头,取而代之的是所谓“肮脏浮动"(即管理
  • 索罗斯的用人之道

  • 索罗斯忠告:“索罗斯始终在你解释某件事情的时候看着你,而且他对你的解释会作出是否合理的分辨。”“他总是在不断寻找着你的弱点,不断地试图发现你所做的事情哪里出了错
  • 索罗斯打入全球金融领袖网脉

  • 索罗斯忠告:“一个由消息灵通者或重要人物组成的关系网是获取投机信息的特殊重要的渠道。” (与全球金融领袖接近可以)获得了对事件的最感性、最真切和最直接的感受。”