2026年7月9日 周四晚上19:30,报名腾讯会议了解“如何构建自进化的动态知识库(Brain)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


收藏

TradExpert:基于大模型的股票交易新模式,年回报率高达49.79%

发布日期:2024-11-20 08:46:55 浏览次数: 4520
作者:灵度智能

微信搜一搜,关注“灵度智能”

TradExpert: Revolutionizing Trading with Mixture of Expert LLMs


人工智能与金融分析的融合,推动了金融领域的创新。传统金融模型主要依赖统计分析和时间序列预测,难以处理非结构化数据。LLMs能够解读复杂的金融数据,能更好地理解和预测市场动态。


本文提出TradExpert框架,结合MoE方法,利用多个专注于不同金融数据的LLM(如新闻、市场数据、因子和基本面数据)。每个专家独立分析数据,最终由通用专家整合分析结果,模拟现实中的分工。


TradExpert在DOW 30股票池中实施了基于Top-K股票的买入持有策略。TradExpert在所有指标上表现优越,年回报率(AR)为49.79%,年波动率(AV)为9.95%,夏普比率为5.01,显示出高回报与低风险的结合。



论文地址:https://arxiv.org/pdf/2411.00782


摘要


TradeExpert是一个新框架,利用混合专家(MoE)方法,结合四个专门的LLM,分析不同的金融数据源(新闻、市场数据、阿尔法因子、基本面数据)。专家LLM的见解由一个通用专家LLM综合,以做出最终预测或决策。TradeExpert可在预测模式和排名模式之间切换,用于股票走势预测和量化交易。除了现有基准,本文发布了一个大规模金融数据集以评估TradeExpert的有效性。实验结果显示TradeExpert在所有交易场景中表现优越。


简介


人工智能与金融分析的融合,特别是大型语言模型(LLMs)的应用,推动了金融领域的创新。LLMs能够解读复杂的金融数据,因金融市场不仅是数字,还涉及新闻、报告和经济指标的复杂信息系统。传统金融模型主要依赖统计分析和时间序列预测,难以处理非结构化数据。发展出专门的金融语言模型(如FinBERT、BloombergGPT、FinGPT),这些模型经过特定金融语料的预训练,能更好地理解和预测市场动态。尽管有进展,如何有效整合历史股价、阿尔法因子、基本面数据和新闻等多种数据源仍是挑战。



本文提出TradExpert框架,结合Mixture of Experts (MoE)方法,利用多个专注于不同金融数据的LLM(如新闻、市场数据、因子和基本面数据)。每个专家独立分析数据,最终由通用专家整合分析结果,模拟现实中的分工。采用重编程机制将时间序列数据转换为与LLM对齐的嵌入。提供两种模式:预测模式(股票走势预测)和排名模式(基于预测选择Top-K股票)。


本文发布大规模金融数据集,作为新的基准。实验结果显示TradExpert在所有交易场景中优于现有基线,消融研究验证了各模块的有效性。


相关工作


金融语言模型近年来显著进步,结合NLP技术与金融分析,从大量非结构化金融数据中提取有意义的洞察。FinBert是基于BERT的金融领域特定模型,BloombergGPT是2023年推出的50亿参数模型,FLANG引入了专门的掩码和目标。Astock平台研究NLP辅助的中国市场股票自动交易算法,BBTFinT5推动了中文金融NLP,FinMA展示了多任务指令数据集的微调模型。FinGPT提供了金融LLM的开源框架,InvestLM展示了指令调优在投资任务中的有效性,FinReport实现了自动财务报告生成。AlphaFin结合检索增强生成技术进行金融分析,展示了金融NLP模型和基准的演进。股票运动预测方面,StockNet利用文本和价格信号,SLOT通过自监督学习处理稀疏推文数据,CH-RNN结合社交文本和跨模态注意力机制。最近研究(Lopez-Lira和Tang 2023;Chen等2023)探讨了ChatGPT在股票运动预测中的应用,比较其与传统模型的表现。


问题建模


研究目标。利用大型语言模型(LLMs)进行股票交易,预测股票价格走势。


输入数据。包括新闻、市场数据(OHLCV)、阿尔法因子和基本面数据(如财报)。


任务1。基于多种数据源预测股票价格涨跌,构建模型 f θ 使其输出“上涨”或“下跌”。


任务2。模拟股票交易,评估基于 TradExpert 的买入持有策略,使用年化收益、夏普比率、年化波动率和最大回撤等指标。


数据集


收集了涵盖四个主要组成部分的综合数据集:新闻、市场数据、阿尔法因子和基本面数据。数据覆盖时间为2020年1月1日至2023年12月31日,共4年。


统计


新闻数据。包含524,995篇S&P 500股票相关的金融新闻,平均596.4字/篇。


市场数据。提供481,484条S&P 500股票的历史日OHLCV记录。


Alpha因子。包含108个技术指标和因子,预测股票价格变动。


基本面数据。包括来自Seeking Alpha的季度财报电话会议记录和财务报表,涵盖每股收益(EPS)、市盈率(P/E Ratio)、每股账面价值(BVPS)等基本指标。


数据划分


数据集按时间顺序分为训练集、验证集和测试集,以确保未来数据在训练过程中未被使用。

  • 训练集:2020年1月1日至2022年6月30日。

  • 验证集:2022年7月1日至2022年12月31日。

  • 测试集:2023年1月1日至2023年12月31日。


方法


提出TradExpert框架,利用MoE LLMs方法,四个专家LLM处理不同金融数据源。一般专家LLM综合四个专家LLM的摘要,生成最终输出。所有专家LLM基于LLaMA2-7B,采用LoRA机制进行监督和微调。训练前对原始数据集进行预处理,构建提示、指令和真实响应。




新闻分析


新闻分析LLM旨在分析新闻文章以预测股票走势。输出包括股票运动预测和基于Chain-of-Thought (CoT)的推理。Ground-truth推理由OpenAI GPT-4 API生成,结合实际股票运动和新闻文本。



市场分析


市场分析LLM专注于分析历史OHLCV数据以预测股票走势,但时间序列数据与LLM的离散结构不匹配,造成使用上的挑战。采用重编程机制将OHLCV数据转化为文本原型表示。OHLCV数据实例X(i)被划分并嵌入为补丁嵌入XP,利用文本原型E'进行重编程。通过多头交叉注意力机制生成重编程补丁的嵌入O(i),并将其投影到LLM的隐藏维度。最终,重编程嵌入与TSFresh提取的统计描述结合,作为Alpha Expert的提示。



Alpha分析


Alpha Expert专注于处理基于表达的alpha因子,这些因子是预测股票价格变动的技术指标和算法生成的因素。利用GPT-4理解复杂表达,生成每个因子的语言描述,构建Alpha数据库。每个alpha记录包含:表达式(基于OHLCV数据的计算公式)和描述(由GPT-4生成)。计算所有alpha因子的值后,通过LightGBM模型得出综合评分,选择对评分贡献最大的Top-K alpha。从数据库中检索Top-K alpha的描述,并与计算值一起用于Alpha Expert的提示和指令。


基本面分析


基本分析师LLM专注于分析基本数据,如财报电话会议记录和财务指标,以预测季度股票价格变动。其预测程序与新闻分析师LLM相似,但基本数据每季度更新,因此预测针对下一个季度。预测结果分为五类:“强上涨”、“中等上涨”、“无变化”、“中等下跌”或“强下跌”,并附有理由。提供的总结报告用于判断股票在接下来的天内是上涨还是下跌。对于两个股票的总结报告,需判断哪个股票在接下来的天内表现更好。


通用专家


通用专家LLM有两种模式:预测模式和排名模式。预测模式用于股票走势预测,输出股票涨跌的二元预测。排名模式用于股票交易,通过比较两只股票的表现来确定排名。使用放宽的比较排序算法(类似于冒泡排序)进行Top-K排名,尽管复杂度为O(N²),但更多比较能提高准确性。通用专家LLM同时在股票预测和比较任务上进行微调。



实验


评估TradExpert框架的两个主要任务:股票走势预测和股票交易模拟。研究问题包括:

  • TradExpert在股票走势预测中的表现与现有基线的比较。

  • TradExpert在真实市场回测中的潜在利润和风险。

  • TradExpert对非结构化数据的推理能力的有效性。

  • TradExpert框架中每个专家的重要性。

  • 选择放松比较排序算法的原因。


数据集


使用两类数据集进行实验:

  • 基准数据集:包括CIKM18、ACL18和BigData22等公开可用的数据集。

  • 专有数据集:包含历史OHLCV数据、新闻文章、阿尔法因子和基本面指标。


实验设置


TradExpert基于LLaMA-2-7B模型,通过LoRA机制进行微调。


股票运动预测。TradExpert以预测模式工作,提供股票涨跌的二元预测,评估指标包括准确率(Acc)和马修斯相关系数(MCC)。


股票交易模拟。TradExpert以排名模式工作,比较并排序股票,通过Top-K股票执行交易,评估指标包括年化收益率(AR)、夏普比率(SR)、年化波动率(AV)和最大回撤(MD)。


基线


股票运动预测基线模型:

  • 混合模型:StockNet, ALSTMW, ALSTM-D, SLOT。

  • 大型语言模型:GPT-4, Gemini, LLaMA2-70B, LLaMA3-8B, FinMA-7B, FinGPTLlaMA2-7B, InternLM7B, Falcon-7B, Mixtral-7B。


股票交易模拟基线模型:

  • 传统模型:随机森林, 决策树, 支持向量机。

  • 深度学习模型:A2C, PPO, SARL, EIIE, DeepTrader。


数据集。所有方法在道琼斯30只股票上进行回测,以降低计算成本。


结果


股票走势预测。实验中使用了多个基线模型,除了闭源模型SLOT外,其他模型均为自实现或开源代码。TradExpert-NM(结合News Analyst和Market Analyst)在所有数据集上表现优于其他模型,除了ACL18的MCC。SLOT在ACL18上表现突出,得益于全球市场指导。InternLM在S&P500数据集上表现优异。S&P500数据集包含较长的新闻文章,导致TradExpert-7B-NM在该数据集上有显著提升。



股票交易模拟。在2023年1月1日至12月31日的回测中,TradExpert在DOW 30股票池中实施了基于Top-K股票的买入持有策略。TradExpert在所有指标上表现优越,年回报率(AR)为49.79%,年波动率(AV)为9.95%,夏普比率为5.01,显示出高回报与低风险的结合。传统模型中,XGBoost回报较高但波动性和回撤也大,风险较高。深度学习模型普遍优于传统模型,DeepTrader表现最佳,回报和夏普比率最高。




消融分析


专家影响评估。通过移除特定专家,评估TradExpert框架中各专家的效果。市场分析师和新闻分析师对盈利和风险管理影响最大,Alpha专家影响较小,基本面分析师对日交易指标影响最小但提供长期稳定性。


结构化数据推理有效性。将TradExpert-MA与传统模型(基于OHLCV数据和alpha因子)进行比较,结果显示TradExpert-MA在RankIC和RankICIR指标上优于传统alpha组合,体现了其推理能力。



排名算法选择。TradExpert采用Top-K排名,尽管计算复杂度较高,但由于LLM比较器的非传递性,更多比较带来更准确的排名,优于QuickSort和BubbleSort等其他算法。



总结


TradeExpert是一个新框架,利用大型语言模型(LLMs)提升股票交易策略,通过整合多个专门的LLM,提供全面的金融数据分析,超越传统金融模型。未来计划将TradeExpert应用于高频交易,并扩展到更多全球市场。


限制。TradeExpert的处理时间平均为4.7秒,虽然适合日常交易,但在高频交易中存在延迟问题。


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询

扫码登录
登录即表示您同意《53AI网站服务协议》
服务协议

欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。

在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。

一、 定义

本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。

会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。

知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。

二、 账号注册与登录

登录方式:本网站支持以下登录方式,您可根据实际情况选择:

微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。

手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。

账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。

实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。

未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。

三、 服务内容与规范

知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。

服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。

禁止行为:您在使用服务时不得实施以下行为:

利用技术手段批量爬取、下载、转存知识库内容;

将知识库内容用于商业目的或未经授权地向第三方传播;

干扰本网站正常运行或侵犯其他用户合法权益;

发布违法违规信息或从事违反公序良俗的活动。

四、 知识产权声明

权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。

有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。

侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。

五、 个人信息保护

我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。

您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。

您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。

六、 免责声明

内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。

不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。

第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。

七、 违约责任

如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。

如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。

八、 法律适用与争议解决

本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。

因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。

九、 其他

本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。

本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。

我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。


已查阅