北京剧本杀 https://www.td010.com 证券收益与风格因子之间不止存在线性关系。本文的研究表明,在因子与收益的线性关系之外,还有很强的待挖掘的非线性关系。 机器学习算法可以用于挖掘非线性关系。因子与收益之间的非线性关系可能是复杂函数,而用机器学习算法可以高效地对这种非线性关系进行建模、近似。 以线性回归的残差训练机器学习模型。线性模型是具有明显含义且相对容易理解的部分。我们保留线性模型的这一优势,用机器学习模型拟合线性回归的残差。 机器学习的训练数据需要进行筛选和处理。训练机器学习模型时,需要选择合适的回顾期和频率。尤其重要的是,输入的回报数据需要进行标准化处理。 采用集成模型的方法降低噪音和提取信号。由于回报数据的低信噪比,机器学习模型总是在拟合信号的同时拟合了噪音,通过训练多个机器学习模型,再将多个模型的预测值取平均,以尽可能消除噪音、保留信号。 通过部分依赖曲线观测机器学习模型的行为。机器学习模型具有黑箱特征,但我们可以通过部分依赖曲线等工具研究其输入、输出之间的关系。通过部分依赖曲线,可以观测到各个因子的非线性贡献的强度。 因子交互效应显著。机器学习方法具有非线性特征,因此可以表征因子共同变化时产生的协同作用,称为交互效应。交互效应对机器学习因子的值具有显著的作用。 剥离机器学习因子中的风格因子。将机器学习因子对风格因子进行回归取残差,可以得到剔除风格因子线性影响后的机器学习残差因子。机器学习残差因子表现出稳定的alpha 因子特征,也是对传统多元线性回归方法的增量因子。 利用新构建的因子进行分组回测。利用机器学习因子分组回测可以得到很高的收益率,但第十组(多头)超额收益在2017 年以后不显著。剔除风格因子影响后,机器学习残差因子的分组回测的第十组总体收益率下滑,但超额收益在近几年表现良好。 因子表现统计。我们用多元线性回归的框架统计了所有风格因子与机器学习残差因子的表现,包括t值、因子收益率、收益波动率、信息比率IR 、R2增益、最大回撤、方差膨胀因子VIF、月自相关系数等,统计结果表明,机器学习残差因子是一个显著的alpha 因子。 因子表现归因。机器学习因子和机器学习残差因子的选股能力来源于所有其他因子的非线性效应的集成。 风险提示:海外市场波动风险,宏观数据、政策变化风险,模型失效风险 (文章来源:德邦证券) 文章来源:德邦证券![]() |
1
![]() 鲜花 |
1
![]() 握手 |
![]() 雷人 |
![]() 路过 |
![]() 鸡蛋 |
业界动态|飞猫网
2025-05-04
2025-05-04
2025-05-04
2025-05-03
2025-05-04
请发表评论