MarketSenseAI:GPT4选股,收益率高达72.87%
1. LLM与选股
资本市场是资本配置的高效渠道,价格发现过程对维持金融系统的健康稳定至关重要。
价格发现过程取决于一系列复杂的相互作用因素,包括公司和行业要素、宏观经济数据、动量效应以及政治和地缘政治影响。市场参与者共同参与这一复杂的价格发现机制,以确保金融市场的有效运行。
股票选择本质上是一种价格发现机制,市场参与者会关注被视为“定价不当”的股票,从而获得相对于整个市场更具吸引力的回报潜力。这一原则构成了价值投资的核心。不过,“定价不当”这一概念还可以进一步深化,因为它可能还涉及到市场对资产公允价值的感知,这种感知未必与其内在价值完全一致。
这可能涵盖对公司未来增长的预期,这一策略通常被称为“成长投资”,有时会忽略当前的基本面。
除了价值投资和成长投资,还有其他因素影响并增加了股票选择的复杂性。被动投资、资本流动、衍生品相关流动以及宏观经济因素等,共同造就了一个本质上具有概率性且常常混乱的金融系统。
市场参与者通过理解和运用广泛的信息来做决策。然而,散户投资者在分析个股时往往面临困境。这一挑战源于他们分析信息的能力有限、易受行为偏差影响以及缺乏强大的风险管理技能。
因此,散户可能错过有前景的投资机会或使自身面临不当风险。
像 ChatGPT 这样的大型语言模型(LLMs)的出现,为财务分析和股票选择带来了极大的提升希望。这些复杂的人工智能(AI)系统,经过大量且多样的语料库训练,不仅展现出了复制人类认知复杂面的能力,在很多情况下甚至超越了人类。
• LLMs 能够迅速解析海量财务数据,从收益报告到宏观经济研究,处理大量非结构化数据(如新闻文章或专家意见)的效率远超人类分析师。这种快速且深入的内容分析,使其能够指出传统分析中常被忽略的模式。
• 人类可能会受认知偏差影响,而 LLMs 则提供了更客观的视角。它们在很大程度上不受可能干扰人类判断的情感和认知偏差影响,不过其训练过程中仍存在一些偏差。此外,LLMs 突破了个人或团队分析师的局限,能在产品、市场以及最重要的投资者之间无缝拓展这种能力。
• LLMs 在降低股票选择中的偏差方面发挥着关键作用。和人类分析师不同,LLMs 不受情感或认知偏差影响,为财务分析提供了更客观的看法。这种客观性对于做出无偏差的投资决策至关重要,因为 LLMs 依靠数据驱动的见解而非主观判断。虽然其训练数据中存在一些固有偏差,但 LLMs 显著减少了人类偏差对投资决策的影响。
本文作者提出了Market Sense AI,利用模块化架构和大型语言模型从海量的数字和文本数据中生成简洁总结,提取有关公司发展和股票潜力的。并结合投资期限等,针对特定股票给出投资建议。
2. Market Sense AI架构
图片
如上图所示,Market Sense AI 的架构框架包括5个组件:
• 前四个核心组件负责数据输入
• 第五个组件负责促进最终推荐(即买入、持有或卖出)
Market Sense AI 效仿专业投资团队的决策流程:通过新闻摘要器追踪公司或其所属行业的最新动态,通过基本面摘要器分析公司的最新财务报表,以及在考虑价格行动动态的情况下对当前环境进行宏观经济分析。
2.1. 新闻摘要组件(Progressive News Summarizer)
与股票有关的新闻,包括公告、报告、分析师观点和研究成果等,对市场情绪以及后续的股票价格影响颇大。这类新闻可能产生短期、长期或甚微的影响。所以,在股票分析中,新闻的来源与解读需要审慎处理。
新闻摘要器负责获取新闻、进行浓缩,并为某只股票的最具影响力的新闻进行渐进式概要。
图片
如上图所示,从新闻 API 中获取与特定股票对应的每日新闻。
每天的个股新闻会预先处理,剔除与公司无关的内容,比如诱导点击类的文章,以确保其格式适合输入提示。通过 GPT4 对股票的每日新闻生成简洁的每日新闻摘要然后进行统一存储。
但是股票的新闻不仅仅是单个独立的新闻重要,股票的新闻往往会综合过去的旧闻持续性产生作用。例如,在合并或法律纠纷的情形下,关于公司业绩好于预期的公告在整体决策过程中或许影响力较小。
新闻摘要组件通过将最新的新闻摘要与之前摘要相结合来解决此问题。更确切地说,提示结构指示 GPT-4 模仿金融分析师的角色,通过整合各类信息为特定股票合成更新的摘要。提示包括:
• 当前摘要 :截至特定年月的公司及其股票的最新摘要。
• 每日新闻摘要 :公司在给定月份的新闻,分为事实新闻和分析师的观点。
• 说明 :整合最相关的信息,区分事实新闻和分析师的意见。
摘要综合考量了过去一个月的每日新闻摘要和上个月的新闻摘要。确保摘要器始终反映最新、最相关且最重要的发展动态,为公司在新闻中的状况提供全面且最新的概览。
图片
如上表,新闻摘要器捕获了2023 年两个不同月份围绕苹果公司(AAPL.US)的发展动态。涵盖了从公司持续的财务表现到战略举措和市场挑战等多个话题。
在 10 月,重点在于苹果在科技行业的重要地位,表现为 iPhone 15 系列的推出以及对其 Apple Watch 和 AirPods 的更新。这一时期还突显了智能手机销售的挑战、地缘政治问题的影响以及股票表现的波动。本月特有的是关于苹果对收购一级方程式广播权的兴趣以及首席执行官蒂姆·库克出售公司股票的报道,展现了公司多样的战略兴趣和高管决策。
到 11 月,尽管许多早期主题延续,但新元素出现。摘要显示了苹果的销售放缓、智能手机市场的竞争压力以及其合作伙伴关系的战略转变,包括与高盛终止信用卡协议。值得注意的是,公司的可持续发展努力和 M3 芯片的推出,以及其在流媒体内容方面的拓展。
下表是一些摘要示例:
图片
2.2. 基本面总结模块(Fundamentals Summarizer)
基本面数据在预测性金融分析中极其重要,提供了可量化的指标,能反映公司当下的状况和未来的走向。
图片
如上图所示,借助 EODHD(https://eodhd.com/) 的基本面数据 API 获取季度信息。
图片
为方便财务数据的比较,在输入提示前,进行预处理。预处理涵盖了特定的数字缩写技术,通过使用“百万”“十亿”或“千”等前缀,把大数字转化为更紧凑的格式。使财务数据标准化并且这一预处理步骤对于让 GPT-4 准确比较和解读复杂的财务数字至关重要。
不同季度的数据以表格形式并列呈现。通过利用GPT-4对比最新的季度财务报表,深入探究盈利能力、收入趋势、债务指标和现金流动态等方面。
对近期数据的关注使 LLM 能够察觉财务表现的变化,可能将其与渐进式新闻相联系。更确切地说,Market Sense AI 利用以下公式对公司的财务状况进行建模:
通过提示词引导 GPT-4 充当金融分析师,分析近期走势:分析指定公司股票的最新季度来评估其财务健康状况,包括:
• 财务表格:来自资产负债表、损益表和现金流量表的最新季度的关键财务数据。
• 分析重点:盈利能力、收入增长、债务水平和现金流生成方面的近期趋势和发展。
尽管大型语言模型(LLMs)在不擅长理解复杂数值数据,但预处理方法与 GPT-4 的能力相结合,能够确保准确的比较与解释。基本面总结器的目的是呈现公司财务状况的客观、真实概览,不给出任何直接的投资建议。
图片
上表展示了基本面总结器如何从财务报表(包括收入、资产负债表和现金流量表)中提取关键观点。
2.3. 股票价格动态总结模块(Stock Price Dynamics Summarizer)
股票价格动态总结模块作为 Market Sense AI 的关键部分,对股票的价格变动和财务指标进行分析。
图片
如上图所示,该模块不但会分析目标股票,还会依据公司描述和所属行业,将其表现与五个最为相似的股票、标准普尔 500 指数进行对比。
识别相似股票的方法:借助 MPNet 语言模型生成嵌入并计算相似性得分。
股票描述由 MPNet 编码为高维向量,捕捉每家公司的独特特征和活动。有利于计算标准普尔 500 中上市公司之间的成对相似性得分。这些得分对于识别具有与目标股票相似属性的股票极为关键,从而确保实现将单个股票表现与更广泛市场趋势相融合的综合比较分析。
获取目标股票、与其类似的股票以及标准普尔 500 指数的市场数据。对关键财务指标进行分析,涵盖 3 个月、6 个月和 12 个月的累计回报和夏普比率,并算出波动率和最大回撤。
尤其是夏普比率和最大回撤,极为关键,分别能了解到股票在市场低迷时期的风险调整回报和抗跌能力。这种全面的分析能广泛了解该股票相对于同行和整个市场的表现。
图片
上图展示了股票价格动态总结模块的结果,将复杂数据提炼为易懂见解。提供了股票相对于类似公司和整体市场趋势的市场动态的多维视角。
2.4. 宏观经济环境综述(Macroeconomic Environment Summary)
宏观经济分析对于做出明智的投资决策和实现有效的资本配置极为关键。能够为整体经济的健康状况和表现提供重要洞见,对单个公司的盈利能力与价值以及整个股票市场都有着显著影响。考虑到诸如新冠疫情或乌克兰战争等塑造投资格局的主要因素,投资者便能做出更明智的抉择。
图片
如上图,该组件每两周对投资报告和研究文章进行整合,为复杂的经济数据和趋势提供简洁的总结。Market Digest 从包括高盛、摩根士丹利、瑞银和贝莱德等领先银行和投资机构的各类公开报告中获取信息。
首先将这些报告和文章转化为文本形式。借助 GPT4 对单个报告进行总结,接着在第二步中将这些单个总结凝练为全面的概述。
使 Market Digest 能够将不同的观点和分析整合成一个连贯的叙述,就宏观经济态势、中央银行政策、优先部门或国家以及地缘政治趋势提供共识性观点。输出简洁且全面,兼顾了市场分析师和专家之间潜在的矛盾或不同看法,包括:
• 初始总结重点:对单个报告进行总结,突出包括中央银行政策、地缘政治见解和市场展望等关键宏观经济要素。
• 综合与情绪分析:对所有报告展开深入剖析,提取共识和分歧观点,重点关注按资产类别或投资维度划分的情绪分析。
• 说明:要求一份详尽且真实的报告,着重于当下的市场情绪以及按资产类别进行的分析分类。
图片
上图给出了 Market Digest 总结的示例。
2.5. 信号生成( Signal Generation)
信号生成组件作为 Market Sense AI 管道的最后一环,整合了来自新闻、基本面、价格动态和宏观经济分析等组件的文本输出,为特定股票给出全面的投资建议和详细的证据。
实际上,一只股票的投资决策取决于一定程度上能从新闻中获取的基础公司最重要的发展情况、公司的财务状况、股票相对于竞争对手和市场的表现,以及更广泛的宏观经济环境。
最先进的 LLM(GPT - 4)具备权衡和推理这些不同类别数据的能力,在复杂金融推理任务中的出色表现就是证明。
实际应用中,GPT - 4 扮演专业金融分析师的角色。采用了思维链策略,通过一个反映专业金融分析师思维模式的逻辑多步推理过程来引导模型。
图片
使用语境学习(in Context Leaerning,iCL)根据当前的财务状况和不断变化的市场数据动态调整分析。这种双重策略使得 MarketSenseAI 能够提供适应不断变化的市场条件和投资者偏好的深刻见解。其提示结构如下:
• 新闻分析:模型首先评估关于目标公司的最新新闻摘要,判断其对股票表现的潜在影响。
• 价格动态分析:接着,它将股票的价格动态与相关股票和整体市场进行对比,提供相对表现的视角。
• 宏观经济环境分析:模型随后评估更广泛的宏观经济形势及其对目标公司的影响,考虑全球经济趋势和事件。
• 基本面分析:最后一步是审查公司的基本财务数据,分析其当前的财务健康状况和未来前景。
模型的输出以简洁的格式呈现,包括一个决策(“买入”、“卖出”或“持有”)以及该选择背后清晰的逐步解释。“买入”和“卖出”在投资组合布局的语境中分别指代多头和空头头寸,而“持有”则意味着在投资组合中不涉及该特定股票。
图片
上表展示了MarketSenseAI在2023年11月末为苹果公司提供可解释投资建议的能力,建议在随后月份的调整后投资组合中维持“持有”状态。
既包括了成功的财务表现和产品发布等积极因素,也包括了销售增长放缓、竞争加剧和监管审查等挑战。综合考虑这些相互矛盾的因素后,“持有”的总体决策展现了一种谨慎的态度。
图片
Market Sense AI 中的文本相似性分析揭示了模型的推理如何与输入数据的动态相契合,对于生成每月投资信号至关重要。
“新闻”和“价格动态”摘要中的高相似性得分(分别为平均得分 0.923 和 0.907)表明模型重视这些快速变化的因素,认识到它们对股票价格的直接影响。对于短期、每月的预测尤其重要,因为当前的发展和价格趋势会极大地左右市场行为。
相比之下,“基本面”和“宏观”组件的输出,平均相似性得分分别为 0.849 和 0.803,对模型的月度决策直接影响较小。基本面每季度更新,提供了公司财务健康状况相对稳定但变化不频繁的情况,而宏观经济数据更广泛和通用,对短期投资决策的影响较为适中。
3. 效果对比
3.1 总体情况
作者选取标普100指数中的股票来评估Market Sense AI性能,评估期从 2022 年 12 月 1 日持续至 2024 年 3 月 31 日。
使用的数据集:
• 新闻:2022 年 12 月 1 日至 2024 年 2 月 29 日期间,共发布 163,483 篇文章,平均每个股票每天 4.57 篇,标准差为 5.49。每篇文章平均标记数为 867,标准差为 1196。这些数据生成了 35,229 个每日的、特定于公司的新闻摘要以及 1,500 个每月的渐进式摘要。
• 基本面:从 2022 年第二季度起,收集了标准普尔 100 股票的 612 份季度报告中的财务数据。该数据集产生了 608 个独特的基本面摘要,平均每个股票约 6 个。
• 描述:每只股票及其所在板块的简要描述,由算法 1 用于识别相似股票。
• 价格:对 2022 年 1 月 1 日至 2024 年 2 月 29 日的历史每日股票价格(调整收盘价)进行分析,以计算股票价格动态。此数据由股票价格动态组件用于为每个股票每月生成一个摘要,总计 1,500 个摘要。
• 宏观:市场摘要分析了 2023 年 4 月至 2023 年 2 月期间主要金融机构发布的 187 份投资报告(每份 20 - 30 页)。对于 2023 年 1 月至 3 月做出的预测,信号生成组件无法获取宏观经济摘要,因此仅有 11 个宏观经济摘要用于信号生成。
总共生成 1,500 个信号(15 个月×100 只股票),对这些信号细分可知,有 338 个“买入”、1150 个“持有”和 12 个“卖出”信号。
3.2. 市场表现评估结果(Bootstrapping)
Bootstrapping 方法能够在处理复杂或未知数据分布时提供一种有效的统计推断手段,通过有放回的重采样数据来估计特定统计量的变化性,包括标准误差、置信区间和各种准确度指标。可以帮助作者确定模型生成的投资信号与传统随机投资信号相比是否具有显著差异。
图片
从上图可以看出,无论是在累计回报(R)还是命中率(HR)上,MarketSenseAI都展现出了在识别有利投资机会方面的能力远超随机猜测。特别是在考虑去趋势回报后,"买入"信号的高命中率量化值表明,与随机信号生成方法相比,MarketSenseAI的推荐有更大的概率成功。这一发现强调了模型在有效识别潜在市场表现优异机会方面的能力,从而证明了MarketSenseAI在投资决策中的实用价值和统计显著性。总的来说,Bootstrapping评估强有力地证明了MarketSenseAI能够产生远超偶然机会的投资信号,证明了其在金融分析中的有效性和可靠性。
3.3. 市场效果评估
3.3.1. 普通策略
图片
作者采用了多种普通策略方法来验证MarketSenseAI的市场效果,这些策略方法包括:
1.同等加权策略(MS):基于MarketSenseAI生成的“买入”和“卖出”信号,构建一个每月重新平衡的同等加权投资组合。
2.仅买入信号策略(MS-L):仅考虑MarketSenseAI的“买入”信号,忽略“卖出”信号,构建一个每月重新平衡的同等加权投资组合。
3.资本化加权策略(MS-L-Cap):基于MarketSenseAI的“买入”信号,构建一个每月重新平衡的资本化加权投资组合。
4.基于夏普比率的排名策略(MS-Top10-SR):选择“买入”信号中夏普比率最高的10只股票,构建一个同等加权投资组合。
5.基于GPT-4排名的策略:利用GPT-4对“买入”信号的解释进行评分和排名,选择排名最高的股票构建投资组合。
验证市场效果的过程中,将这些策略的表现与S&P 100指数的同等加权和资本化加权组合以及基于移动平均线的朴素趋势跟踪策略(Naive)进行了比较。比较的指标包括总回报、夏普比率、索提诺比率、波动性、胜率和最大回撤等。
图片
最终效果显示:
•MS策略:总回报达到了35.48%(考虑交易成本后为32.94%),夏普比率为2.49,索提诺比率为3.87,显著优于S&P 100的同等加权组合。
•MS-L策略:由于“卖出”信号较少,其表现与MS策略相似,总回报为35.79%(考虑交易成本后为34.82%)。
•MS-L-Cap策略:在资本化加权的情况下,总回报达到了66.22%(考虑交易成本后为65.25%),远超S&P 100 ETF的43.27%。
•基于GPT-4排名的策略:特别是MS-Top10-GPT策略,总回报达到了49.09%(考虑交易成本后为48.07%),夏普比率为2.68,索提诺比率为4.29,胜率为74.1%,最大回撤为7.66%,在所有策略中表现最佳。
综上所述,MarketSenseAI生成的信号在多种普通策略方法下均显示出卓越的市场效果,不仅在总回报上超越了基准指数,而且在风险调整后的回报指标上也表现出色,验证了MarketSenseAI在实际投资决策中的有效性和优越性。
3.3.2. 基于排名的策略
图片
利用基于排名的策略来验证MarketSenseAI的市场效果,主要是通过以下几种方式:
1.基于夏普比率的排名策略(MS-Top10-SR):
- 这种策略选择“买入”信号中夏普比率最高的10只股票,构建同等加权的投资组合。
- 结果显示,MS-Top10-SR策略的总回报为23.13%(交易成本后为22.12%),夏普比率为1.45,索提诺比率为2.11。
2.基于GPT-4排名的策略:
• 这些策略利用GPT-4对“买入”信号的解释进行评分和排名,选择排名最高的股票构建投资组合。
• 具体包括MS-Top5-GPT、MS-Top10-GPT、MS-High-GPT和MS-Low-GPT策略,它们分别选择GPT-4排名最高的5只股票、10只股票、高于7分的股票和7分及以下的股票。
3.资本化加权的基于GPT-4排名的策略(MS-Top10-Cap-GPT):
• 这种策略对GPT-4排名最高的股票采用资本化加权方法,构建投资组合。
图片
最终效果如下:
•MS-Top5-GPT和MS-Top10-GPT策略:
MS-Top5-GPT策略的总回报为50.96%(交易成本后为49.67%),夏普比率为2.26,索提诺比率为3.69。
MS-Top10-GPT策略的总回报为49.09%(交易成本后为48.07%),夏普比率为2.68,索提诺比率为4.29,胜率最高,达到74.1%,最大回撤为7.66%。
•MS-High-GPT和MS-Low-GPT策略:
MS-High-GPT策略的总回报为39.47%(交易成本后为38.35%),夏普比率为2.28,索提诺比率为3.44。
MS-Low-GPT策略的总回报为25.66%(交易成本后为24.27%),夏普比率为1.76,索提诺比率为2.64。
•MS-Top10-Cap-GPT策略:
该策略的总回报达到了72.87%(交易成本后为71.64%),是所有策略中表现最好的。
基于排名的策略在验证MarketSenseAI市场效果时表现出色,尤其是那些利用GPT-4进行排名的策略,它们在总回报、夏普比率、索提诺比率等关键指标上均优于传统的基于夏普比率排名的策略。这些结果进一步证实了MarketSenseAI在投资决策中的有效性,以及GPT-4在解释和排名投资信号方面的强大能力。
本文转载自大语言模型论文跟踪,作者:HuggingAGI