常见概率模型在金融市场中的应用

1评论 2017-10-07 11:53:59 来源:要资讯 作者:华泰期货研究院量化策略组 陈维嘉 这些股越跌越买!

  本文首发于微信公众号:要资讯。

  概率模型简介

  概率模型是一大类模型的统称,是常规金融模型的概率化表达。通常概率模型会把常规金融模型中的某些参数看作是一个未知的概率分布,这个未知的分布通常会预先给定一个基本假设,即先验概率,然后再根据具体的观测数据去推断或者逐步修正这些假设。一种比较常见的概率模型就是贝叶斯线性回归模型,这类模型把线性回归中的系数 和截距等参数作为未知的概率分布。另外一类是最近二十年兴起的状态空间模型(State- Space Model, SSM)和隐含马尔科夫模型(Hidden Markov Model, HMM),这类模型假设在可 观测数据背后包含了某种隐含模式,并且可以利用条件概率分布来发掘这些隐含模式来 总结数据规律以及预测未来数据。SSM 通常用于描述连续的隐含状态而 HMM 通常指有 限的隐含状态。这类模型首先在物理学中得到应用,随后在自然语言处理中被发现取得 良好效果。目前这类模型也常出现在金融、经济等学术论文中用于检验经济指标有效性 或者用作预测。这类模型在国外一些对冲基金公司也有所应用。

  概率模型可以比灵活地从较少量数据中调校出来,但是在传统机器学习问题上,比 如分类,非线性回归等,这类模型效果在精确性和扩展性方面表现不会特别好。而另一 方面,深度学习在图像识别、语音识别方面取得较大突破,其原因之一是大数据为较复 杂的模型架构提供了支持。如果把这两者的优势结合,则有可能在少量数据的基础上构 造出较为复杂的模型,例如贝叶斯神经网络。

  本报告将简单介绍概率模型的构造流程,常见概率模型的类型,最后给出贝叶斯线 性回归模型和贝叶斯神经网络在期货预测中的应用例子。

  概率模型构建流程

  概率模型的构造通常要求对待预测的问题有一个直观的认识,比如从可观测数据库存,现货价格,利率,工厂开工率,产品优良率,成交量和持仓量等信息中推断出期货价格可能由基本面,宏观,流动性等不可观测的因子在背后驱动期货价格涨跌。由此构造出有一定经济学含义的模型,并且加入一定的主观预期,即模型参数的先验分布。再由可观测数据去推断出这些隐含因子对期货价格的影响作用,也就是说利用特定的推断算法 计算后验分布。最后使用后验分布来测试模型,找出其优点和缺点,如果能满足则该概率 模型在此问题上有一定的解决能里,否则则重新修改。这就是Box循环,如下图所示。

Box循环清晰地把以下几个步骤区分开了:把主观认识加进模型,根据数据进行推断,在现实环境中进行模型评价以及根据结果修改模型假设。第一个步骤概率模型构造由于需要加入对期货价格行程的主观认识,这个步骤更像是一个艺术过程。研究员甚至可以把商品产业链的相关信息编进概率模型中,例如一个简单的豆粕和豆油的部分产业链可以如下图表示。从大豆种植面积开始经过贸易,加工等环节生产出豆粕和豆油,这里面的各种因素都会对其最终价格产生影响,而其下游产物也可能由于供需关系的变动对原材料产生影响,这一系列过程可以都用一类称作贝叶斯网络的概率模型来表示,模型参数就是各个流程之间的条件概率分布。随着研究员的认识深入,这个网络可以不断扩展。甚至添加一些变量,例如贸易利润和加工成本可能同时受制于某些不可观测的宏观因素。

  Box循环清晰地把以下几个步骤区分开了:把主观认识加进模型,根据数据进行推断,在现实环境中进行模型评价以及根据结果修改模型假设。第一个步骤概率模型构造由于需要加入对期货价格行程的主观认识,这个步骤更像是一个艺术过程。研究员甚至可以把商品产业链的相关信息编进概率模型中,例如一个简单的豆粕和豆油的部分产业链可以如下图表示。从大豆种植面积开始经过贸易,加工等环节生产出豆粕和豆油,这里面的各种因素都会对其最终价格产生影响,而其下游产物也可能由于供需关系的变动对原材料产生影响,这一系列过程可以都用一类称作贝叶斯网络的概率模型来表示,模型参数就是各个流程之间的条件概率分布。随着研究员的认识深入,这个网络可以不断扩展。甚至添加一些变量,例如贸易利润和加工成本可能同时受制于某些不可观测的宏观因素。

常见概率模型在金融市场中的应用

  期货研究员如果对某一商品品种有一定认识都可以构建出类似的概率模型,然后把可观测数据交给模型利用特定的推断算法计算出模型参数的后验分布。对大多数概率模型来说,根据可观测数据进行调校都不是简单的步骤,两种常用的方法是马氏链蒙特卡罗和变分推断。调校后的模型是否有效则受制于更多因素,例如数据质量,数据样本是否足够多,概率模型的推断方法选取是否适当等等。最后可以用后验预测检验(Posterior Predictive Checks, PPC)来评价模型对数据的拟合程度以及交叉验证来评价模型的预测能力。

  概率模型类型

  概率模型包含了一大类模型,在金融建模中经常会用到,但是他们的名称常常不统一,例如常用的regime-switch 模型通常包含2-3个regime,他们其实就是一类特殊的隐含马尔科夫模型。David M. Blei 在 Build, Compute, Critique, Repeat: Data Analysis with Latent Variable Models(2014)中总结了几类常用的概率模型,其架构如下图所示。图中深蓝色 圆圈为可观测变量,白色圆圈代表不可观测变量,深蓝色方框代表固定的模型超参数。灰色的箭头表示各个变量之间的依存关系。其中的混合会员模型(mixed membership)常用于无监督的聚类分析,矩阵因子分解模型(matrix factorization)则用于特征分解,如用户行为分析等,这两类概率模型在金融上的应用较为少见,所以在这里不作讨论,下面主要介绍其他几种在金融中较为常见的概率模型

1.贝叶斯线性回归(Bayesian Linear Regression, BLR)

  1.贝叶斯线性回归(Bayesian Linear Regression, BLR)

  这类模型比较基础,主要就是把通常线性回归模型中的系数看作是未知分布,可以用如下式子表示

常见概率模型在金融市场中的应用

  其中ft1为自变量因子。A 和b为贝叶斯模型的系数和截距,其先验分布均通常取为标 准正态分布,但也可根据具体情况采用其他与现实情况更为接近的分布。rt的预测误差服从 正态分布(0, 2),其方差2可取标准对数正态分布。这里的参数= {, b, 2}的后验分布 都是通过历史数据进行马尔科夫链蒙特卡诺或者变分推断。在推断出后验分布后就可以计 算rt的后验分布了,也就是给定了当前因子下的条件概率分布(rt|, )。

  2.隐含马尔科夫模型(Hidden Markov Model, HMM)

  隐含马尔科夫模型在线性模型的基础上可以用公式表示为

常见概率模型在金融市场中的应用

  其中St1为当前的区域变量(regime),其取值是离散的St1 = 1,2,3, …。通常在金融应用中只取2-3个区域,例如当St1=1时,市场处于上升状态,当St1= 2时,市场处于调整状态,当St1=3时,市场处于下跌状态。而有的模型会忽略掉市场的调整状态,只取剩下两种。同时模型通常也会假设各个状态之间的存在一个转移概率矩阵,这个转移概率和在各个状态下的系数A都是不可观测的,他们可以是固定的参数也可以是贝叶斯化的概率分布。模型 的使用者并不知道当前市场处于哪个区域,需要从可观测数据中使用特定算法进行推断出当前市场所处区域的概率,将来市场所处的概率,以及市场出现转换的概率。

  在实际使用当中HMM的具体形式可能会稍作变化,例如Andrew Ang在How do Regimes Affect Asset Allocation?(2002)中使用了如下形式的HMM来研究在牛市和熊市中如何调节资产配置方案。在其论文中,股票超过政府债券的额外收益t表示为

Min Dai 等人在 Optimal Trend Following Trading Rules (2011)中把 HMM 加入到随机过程模型中。例如用ft表示在t时刻的股票价格,满足如下随机过程

  Min Dai 等人在 Optimal Trend Following Trading Rules (2011)中把 HMM 加入到随机过程模型中。例如用ft表示在t时刻的股票价格,满足如下随机过程

其中()为预期收益率,其值取决于所处的两个牛市或熊市区域,为常数波动率,与所处regime无关,是标准布朗运动。下表中列出了利用 S&P500 校正该 HMM 模型的参 数值,其中1和2分别是牛市和熊市的期望收益,1和2是从牛市转移到熊市和熊市转移 到牛市的转换强度。从表中可以看出这些参数在 2008 年以前都比较稳定,2009年达到峰值,之后开始回落,这跟 2008-2009年间美股出现的大幅下滑表现一致,尤其是1达到最大值,说明市场有强趋势向熊市转换。由此可见该HMM模型对市场有一定的描述能力。

  其中()为预期收益率,其值取决于所处的两个牛市或熊市区域,为常数波动率,与所处regime无关,是标准布朗运动。下表中列出了利用 S&P500 校正该 HMM 模型的参 数值,其中1和2分别是牛市和熊市的期望收益,1和2是从牛市转移到熊市和熊市转移 到牛市的转换强度。从表中可以看出这些参数在 2008 年以前都比较稳定,2009年达到峰值,之后开始回落,这跟 2008-2009年间美股出现的大幅下滑表现一致,尤其是1达到最大值,说明市场有强趋势向熊市转换。由此可见该HMM模型对市场有一定的描述能力。

3.状态空间模型(State Space Model, SSM) 状态空间模型是隐含马尔科夫模型的进一步扩展,其线性形式可以表示为

关键词阅读:概率模型 线性回归模型 模型参数

责任编辑:祝玉婷 RF13009
快来分享:
评论 已有 0 条评论
精彩推荐
基本面转弱 螺纹钢基差面临修复

2017-12-13 08:46:30来源:期货日报

国际巨头囤货 钴价继续上行

2017-12-13 06:34:23来源:上海证券报

供需偏紧 PTA短期下跌空间恐有限

2017-12-13 08:44:43来源:中国证券报 马爽

期市收评:黑色系弱势震荡 化工品多数飘绿

2017-12-13 15:07:06来源:金融界期货

Lgmi:期螺高位跳水 钢坯创6年新高 钢市哪里是方向?

2017-12-13 09:48:49来源:兰格钢铁网

12月份钢企盈利 仍将保持高位

2017-12-13 02:44:48来源:投资快报

产蛋鸡存栏量减少 蛋价续跌空间将有限

2017-12-13 02:30:45来源:中国证券报

苹果期货创新交割方式 货主可折算注册仓单

2017-12-13 08:41:24来源:中国证券网 宋薇萍

供给压力堪忧 甲醇中期恐将转弱

2017-12-13 02:32:35来源:中国证券报

商品日评:郑糖上涨动能不足 看涨期权普遍下跌

2017-12-13 02:45:14来源:投资快报

美联储将实施加息 黄金盘整交易者漠视恐慌情绪

2017-12-13 23:56:07来源:FX168财经网

原油短期内价格存在回调风险

2017-12-13 22:19:00来源:期货日报网

期市早评:黑色系开盘领跌 螺纹钢主力跌超2%

2017-12-13 09:02:23来源:金融界期货

豆粕下方空间有限

2017-12-13 22:19:00来源:期货日报网

芝商所日元汇率期现价差交易策略

2017-12-13 22:04:03来源:期货日报

苹果期货交割区域覆盖主产区及集散地

2017-12-13 22:03:55来源:期货日报

下行空间有限 玉米中长线存多头机会

2017-12-01 03:00:15来源:中国证券报

上期所11月对7起涉嫌违规交易行为立案调查

2017-12-13 22:03:56来源:期货日报

【SMM分析】PE527+Kalongwe 华友钴业上游资源开发力度遒劲

2017-12-13 22:36:30来源:上海有色网

螺纹钢宜逢高沽空

2017-12-11 22:21:04来源:期货日报

加载更多

更多>> 以下为您的最近访问股
理财产品快速查询
实时热点