简单观察|「华泰金工林晓明团队」再探AlphaNet:结构和特征优化——华泰人工智能系列之三十四
林晓明S0570516010001
SFCNo.BPY421研究员
陈烨S0570518080004研究员
李子钰S0570519110003研究员
何康S0570118080081联系人
报告发布时间:2020年8月24日
摘要
本文从网络结构和特征优化的角度改进AlphaNet , 回测表现更好
华泰金工前期报告《AlphaNet:因子挖掘神经网络》(2020.6.14)提出了AlphaNet-v1模型 。 然而AlphaNet-v1在2019年下半年之后表现欠佳 , 针对该问题 , 我们分别从神经网络结构和特征的角度进行改进 , 构建了AlphaNet-v2和AlphaNet-v3两个升级模型 , 并在多个股票池内测试 。 结果显示 , 在全A股和中证800成分股中AlphaNet-v2表现优于AlphaNet-v1 , 在中证500成分股中AlphaNet-v3表现小幅优于AlphaNet-v2 。 另外 , 本文总结对比了“遗传规划+随机森林”模型和AlphaNet的优缺点 。
本文介绍了两个改进模型:AlphaNet-v2和AlphaNet-v3的改进思路
相比AlphaNet-v1 , AlphaNet-v2改进了以下几点:(1)考虑到比率类特征的有效性 , 扩充了6个比率类特征;(2)将池化层和全连接层替换为LSTM层 , 从而更好地学习特征的时序信息;(3)训练集和验证集划分从1:1变成4:1 , 验证集更关注近期样本的表现 。 相比AlphaNet-v2 , AlphaNet-v3改进了以下几点:(1)扩充特征提取层 , 特征提取层1和特征提取层2中的运算函数具有不同的回看区间(10和5);(2)将LSTM层替换为GRU , 减少模型参数 。
在全A股和中证800成分股中 , AlphaNet-v2表现优于AlphaNet-v1
设定回测期为20110131~20200731 , 调仓周期为10个交易日 。 在全A股中 , AlphaNet-v2相比AlphaNet-v1的RankIC均值从9.72%提升至10.76% , ICIR从1.00提升至1.15 。 构建相对于中证500的行业、市值中性的全A选股策略 , 年化超额收益率从17.17%提升至19.09% , 信息比率从2.73提升至3.13 。 在中证800成分股中 , AlphaNet-v2相比AlphaNet-v1的RankIC均值从8.37%提升至8.63% , ICIR从0.73提升至0.75 。 构建相对于中证800的行业、市值中性的选股策略 , 年化超额收益率从6.19%提升至7.84% , 信息比率从1.65提升至2.00 。
在中证500成分股中 , AlphaNet-v3表现小幅优于AlphaNet-v2
设定回测期为20110131~20200731 , 调仓周期为10个交易日 。 在中证500成分股中 , AlphaNet-v3相比AlphaNet-v2的RankIC均值从9.05%提升至9.70% , ICIR从0.89提升至1.00 。 构建相对于中证500的行业、市值中性的选股策略 , 年化超额收益率从9.40%提升至9.75% , 信息比率从2.19提升至2.30 。
本文总结对比了AlphaNet和“遗传规划+随机森林”模型的优缺点
AlphaNet和“遗传规划+随机森林”模型都是基于量价数据的人工智能选股模型 , 本文对比了二者的优缺点 。 AlphaNet的优点是:端到端学习使得因子挖掘和因子合成使用同一目标函数进行优化 , 且无需维护因子池 , 从而无需做大量的单因子测试、因子相关性分析、因子中性化等工作 。 另外 , 只需按情况对网络结构做一定调整 , 就可针对任意的股票池、预测周期、数据频率构建预测模型 , 省时省力 。 AlphaNet的缺点是:模型可解释性较低 , 目前可嵌入神经网络的特征提取层还比较有限 , 没有覆盖遗传规划中全部因子计算函数 。 “遗传规划+随机森林”模型的优缺点则正好相反 。
风险提示:通过人工智能模型构建的选股策略是历史经验的总结 , 存在失效的可能 。 神经网络受随机性影响较大 , 使用需谨慎 。 机器学习模型解释方法存在过度简化的风险 。
本文研究导读
在华泰金工2020年6月14日发布的报告《AlphaNet:因子挖掘神经网络》中我们指出:AlphaNet通过自定义特征提取层 , 能以端到端的方式有效提取股票原始量价数据中的特征 , 并展示了第一个版本:AlphaNet-v1的构建细节 。 然而AlphaNet-v1在2019年下半年之后表现欠佳 , 针对该问题 , 我们分别从神经网络结构和特征的角度进行改进 , 构建了AlphaNet-v2和AlphaNet-v3两个升级模型 。 对于AlphaNet-v2 , 我们在多个股票池内测试 。 对于AlphaNet-v3 , 由于模型复杂训练较慢 , 我们仅在中证500成分股内测试 。
推荐阅读
- 武契奇|塞尔威亚总统武契奇:我在白宫捍卫了和中国的关系
- ipo观察|李书福的身价能赶超马克斯吗?,吉利汽车IPO后
- 网红美食|网红甜点椰丝球自己动手做,简单零失败,甜丝丝的吃不胖
- 中国新闻网|服贸会观察:区块链为何能成全球贸易“助推器”?
- 【】服贸会观察:区块链为何能成全球贸易“助推器”?
- 央视网|新闻观察:北京自贸区呼之欲出 实施好营商环境改革4.0系列政策措施
- 川报观察|邻水这个贫困户把院子变成了花园 还从东北“摇”回一个媳妇儿
- 徐婷|4年前,徐婷在北京全身溃烂而亡,其实背后不只是患癌这么简单
- 澎湃新闻|全球城市观察︱搬回父母家,疫情期间“回巢”的美国年轻人
- 新闻观察:北京自贸区呼之欲出 实施好营商环境改革4.0系列政策措施
