分类
2022年最佳外汇经纪商

肥尾分布的统计效应

赵 蓓 | 邹 曦

肥尾效应 查看源代码 讨论 查看历史

尾端/极端风险(Tail Risk)是指统计学上两个极端值可能出现的风险,按照常态的钟型分布(Bell Shape),两端的分布机率是相当低的(Thin Tails);但是两个极端值的分布亦有可能出现厚尾/肥尾(Fat Tails)风险,那就是距离中值(Mean),出现的机率提高。也就是原本不太可能出现的机率突然提高了,运用在金融市场上,那就是极端行情出现的可能性增加而且频繁,这样可能会造成市场行情的大幅震荡,造成的原因可能是市场上出现不寻常的事件,如2008年雷曼兄弟倒闭、2010年的南欧主权债信危机,皆产生肥尾效应。 [1]

将时间回推至去年 9 月,市场在雷曼兄弟宣布破产之后开始大幅修正,从当时至年底才短短三个月期间,国内定期定额笔数即减少 22%,之后,虽然市场开始强劲上扬,国内定期定额笔数仍没有太大的变化,直到今年六月,国内定期定额笔数才开始回升,但股市已经涨了一波。

肥尾分布的统计效应

尾端风险/极端风险(Tail Risk)是指统计学上两个极端值可能出现的风险,按照常态的钟型分布(Bell Shape),两端的分布机率是相当低的(Thin Tails);但是两个极端值的分布亦有可能出现厚尾风险/肥尾(Fat Tails)风险,那就是距离中值(Mean),出现的机率提高。也就是原本不太可能出现的机率突然提高了,运用在金融市场上,那就是极端行情出现的可能性增加而且频繁,这样可能会造成市场行情的大幅震荡,造成的原因可能是市场上出现不寻常的事件。

戴国晨专栏|塔勒布量化开篇之作《肥尾分布的统计效应》(上)

今天这篇文章来自塔勒布哲学理念的数量化版本Statistical Consequences of Fat Tails,全书400余页,由戴国晨研读后用可读性比较强的方式为大家进行细致讲解,戴国晨戴国晨说:“整体读完对我帮助很大,结合之前听他上课时候的内容有豁然开朗的感觉,书里面包含了对肥尾分布不同角度的分析理解。我没有直接做翻译,而是采用笔记的形式。一来是塔勒布老师的文字本身比较晦涩,二是塔勒布老师在量化领域深耕多年,里面有一些数学炫技的成分,我尽可能的对内容做了一些简化。在术的层面上这是一本很有价值的书,通过里面的期权部分我大概能猜出Universa尾部对冲策略的超额收益来源···”

杰晶维基尊重并感谢每一位志愿者的劳动成果,希望突出大家的贡献,杰晶维基翻译计划虽成立短短数月,但已经是一个拥有数十名志愿者的大家庭,大家利用工作之余已经翻译了百余篇好文章,有一些我们还没有推送出来,我们不在意是否有10+万,只希望为各位专业投资者带来更多好内容, 再次 欢迎各位伙伴申请加入!

文章来源 | Statistical Consequences of Fat Tails

面对随机性事件,人们可能面对的风险有如下几种(1)不知道分布的类型和性质(2)知道分布的类型和性质,错误的估计了参数(3)黑天鹅。

认知真相无比之难,经验之外不可知的那一部分总是让人寝食难安,此时应该如何应对呢?塔勒布的哲学拨云见日:反脆弱,不用做预测大师,只需要改变赔付关系即可。在黑天鹅降临之时,具备反脆弱特性的事物不但不会受损,反而还能有巨大收获。

— 第一部分 序言 —

了解世界越是浅薄,决策越是轻易

我们生活的世界极度复杂,充斥着不透明和不确定性,但是人们却对如何理解和应对极端不确定性少有研究。在承受巨大风险的同时,却又笼统的把罕见的事件归为一类,套用“黑天鹅”和“肥尾”来进行解释。这里的谬误在于(1) 黑天鹅代表完全超出经验框架的事件,罕见事件仍有经验可依不属于此范畴。(2) 知晓肥尾概念和真正了解其统计效应之间仍然存在鸿沟,在不同类型的肥尾下人们所面临的冲击有天壤之别,只有真正去了解尾部性质,差异化的采取保护措施才能有效管理风险。

INCERTO系列丛书 (2001-2018)

随机漫步的傻瓜FOOLED BY RANDOMNESS

黑天鹅THE BLACK 肥尾分布的统计效应 SWAN

普洛克路斯忒斯之床THE BED OF PROCRUSTES

利益攸关SKIN IN THE GAME

INCERTO谱系

— 第二部分 词汇表 —

— 第三部分 肥尾效应简介 —

①平均斯坦(薄尾)

②极端斯坦(肥尾)

灾难原则

平均斯坦中的灾难是“好事”(可控且能帮助人们完善对分布的认知),极端斯坦中灾难是坏事(可能直接摧毁一切) ,举例对比不同环境中的两种灾难事件(1)某架飞机失事会导致机组人员丧生和(2)某架飞机失事会导致所有坐过飞机的人丧生,前者可以帮助飞机制造商和保险公司评估飞机失事概率,并作出改进,但后者的破坏力量太大,可能会导致人类灭亡。因此对于前一种事件,我们的目标是如何降低发生概率。而对后一种事件我们不算概率,目标在于如何降低其影响,或是完全杜绝它发生。在金融市场中类似的两种状态是(1)出现危机会导致企业利润降低(2)出现危机会导致企业破产,甚至加剧危机的蔓延,遗憾的是后者非常常见。

肥尾程度(不同分布由轻到重)

α≤3 超立方分布, 肥尾分布的统计效应 分布只有均值和方差,高阶矩不存在

因此在这里可以对肥尾(Fat Tail)和厚尾(Thick Tail)做一定区分。当人们讨论厚尾分布时,往往指的只是峰度大于正态的分布,但是肥尾分布对应的是“极度厚尾分布”,分布的峰度甚至都不存在,和分布也不再收敛于正态分布。

大数定律的收敛情况

肥尾效应的一些后果

现实世界中大数定律可能有效,但是会收敛的太慢

由于样本规模的问题,样本均值一般总是会偏离分布均值,尤其是在不对称分布中

在金融领域所有的分布都是肥尾分布,一些统计量如方差和标准差并不可信,由此衍生出的beta,夏普比率,协方差矩阵等金融量也不可信。下图中的横轴为08年金融危机前对冲基金的历史夏普比率,纵轴为金融危机中的基金损失,可以看到历史波动对规避未来损失并无预测作用,在危机中很多基金出现了10个“标准差”以外的损失。

肥尾分布的统计效应 稳健统计并不稳健 (修正极值会导致信息丧失),经验分布的经验有限(最糟情况会超出经验)。

最小二乘法线性回归会失效 (方差不存在,小样本效应)。

即使是肥尾分布,对于一些统计量的极大似然估计依然有效 ,此时通过估计尾部参数α反推变量分布,再求解分布均值要比对样本直接求均值准确的多。

证实和证伪人们经验的难度比想象的要大。

主成分分析和因子分析会失效 ,肥尾条件下为得到稳定结果所需的样本量极大。

对样本求统计量会失效 ,分布的高阶矩很可能不存在,导致每个样本矩都不同且不收敛。

对极端情况下发生的损失量级很 难进行估计。 在高斯分布下CVAR等极端统计量还有一定意义,而肥尾分布中出现的损失可能会大到超出想象。

类似于基尼系数这样的参数不具备可加性。 欧洲各个国家基尼系数的加权平均会小于整个欧洲大陆的基尼系数。其他如1%的人拥有x%的财富的指标也不具备可加性。

动态对冲无法解决期权的真正风险。

重视概率忽视赔付在肥尾条件下会导致更大的问题。 现实世界中的回报并不是基于概率,而是基于赔付,但是人们在直观上更在意概率预测。一个例子是交易员预测市场上涨,但是做空市场——因为上涨空间有限而下跌空间巨大。同样的道理,一个大概率赔钱的策略不一定是糟糕的策略,只要没有破产风险且小概率能获得巨大收益即可,如尾部对冲策略(Universa);一个胜率99.99%的策略也不一定是好策略,如果不能完全规避破产风险前期盈利都会归零,如杠杆统计套利(LTCM)。

肥尾条件下对实际分布估计的微小偏离都可能带来巨大的赔付偏差。 下图中的x,y轴为实际频率和预测频率,向上或向下偏离y=x分别为低估和高估。可以看到在预测概率相差不大的情况下(绿线),对α=1.15的帕累托分布进行下注,其赔付结果相距甚远(红点)。由于存在非线性关系,市场参与者的概率预测误差和最终赔付误差完全是两类分布,概率预测误差是是统计量,在0到1之间,因此误差分布是薄尾的,而赔付的误差分布是肥尾的。

从冥率分布到不确定性,塔勒布的哲学宇宙

总的来说,概率只是积分内部的核函数,真实世界中重要的是赔付,也即概率事件对每个人的实际影响。金融领域风险管理的本质在于改变赔付关系,而不在于追求正确预测,因为在肥尾分布下你很难进行“正确量级的预测”。因此只要在赔付关系上有利于自身,哪怕降低预测精度也无妨。反过来说,预测准确率的提高如果对应赔付的大幅恶化,这样的准确并没有意义。如人们所说,同样是犯错误,把熊误认为是石头远远比把石头误认为是熊糟糕的多!

安 昀 | 鲍无可 | 薄官辉 | 曹 晋 | 曹文俊 | 常 蓁

陈璇淼 | 陈 媛 | 陈立秋 | 陈 军 | 陈觉平 | 肥尾分布的统计效应 陈 宇

程 洲 | 崔 莹 | 蔡嵩松 | 蔡 滨 | 董伟炜 | 杜晓海

付 斌 | 费 逸 | 方钰涵 | 方 纬 | 高兰君 | 刚登峰

葛 晨 | 顾耀强 | 光 磊 | 归 凯 | 郭 敏 | 郭 锐

郭 堃 | 韩 冬 | 郝旭东 | 郝 肥尾分布的统计效应 淼 | 何 帅 | 何晓春

洪 流 | 胡昕炜 | 胡鲁滨 | 胡宜斌 | 胡 涛 | 黄 峰

姜 诚 | 纪文静 | 焦 巍 | 贾 鹏 | 匡 伟 | 劳杰男

雷 鸣 | 李德辉 | 李 琛 | 李晓西 | 李晓星 | 李元博

李耀柱 | 李玉刚 | 李健伟 | 李佳存 | 李 巍 | 李晓星

李 竞 | 黎海威 | 梁 浩 | 梁 辉 | 梁 力 | 廖瀚博

林 庆 | 刘 斌 | 刘 辉 | 刘格菘 | 刘晓龙 | 刘 苏

刘 锐 | 刘 平 | 陆 彬 | 陆政哲 | 陆 欣 | 罗春蕾

吕越超 | 楼慧源 | 马 翔 | 马 龙 | 莫海波 | 牛 勇

潘 明 | 肥尾分布的统计效应 蒲世林 | 齐 皓 | 祁 禾 | 秦 毅 肥尾分布的统计效应 | 秦绪文

丘栋荣 | 邱 杰 | 饶 刚 | 石 波 | 沈 楠 | 沈雪峰

史 伟 | 是星涛 | 孙 伟 | 汤 慧 | 唐颐恒 | 谭冬寒

谭鹏万 | 谭 丽 | 田彧龙 | 王 涵 | 王 俊 | 王 培

王 栩 | 王延飞 | 王宗合 | 王克玉 | 王 景 | 王诗瑶

王晓明 | 王园园 | 魏晓雪 | 魏 东 | 翁启森 | 吴 星

吴丰树 | 吴 印 | 伍 旋 | 肖瑞瑾 | 谢书英 | 谢振东

徐荔蓉 | 徐志敏 | 徐 成 | 许文星 | 许 炎 | 颜 媛

杨 栋 | 杨 浩 | 杨 瑨 | 杨锐文 | 杨 帆 | 杨岳斌

姚 跃 | 姚志鹏 | 叶 展 | 易智泉 | 于 洋 | 于善辉

袁 宜 | 袁 航 肥尾分布的统计效应 | 袁 曦 | 张东一 肥尾分布的统计效应 | 张 峰富国

张 峰农银汇理 |张 锋 | 张汉毅 | 张 晖| 张 慧

张金涛 | 张 骏 肥尾分布的统计效应 | 张 萍 | 张延鹏 | 张迎军 | 张益驰

赵晓东 | 郑慧莲 | 郑 磊 | 郑巍山 | 郑 伟 | 周应波

周克平 | 周 良 | 周雪军 | 朱 平 | 朱晓亮 | 左金保

赵 蓓 | 邹 曦