基于LLM的多Agent框架在金融市场数据的应用
架构
图片
上图展示了本文的整体架构:结合了传统的统计技术和大型语言模型驱动的多智能体系统。首先利用从简单的规则、无监督学习和深度学习技术等现有手段,对金融表格数据中的异常进行识别。异常识别后,将数据传到LLM多智能体系统中。
整个系统包括:数据转换Agent、数据专家Agent、报告整合Agent、管理层讨论。
其中数据专家Agent包括三个专家:
• 网络调研专家:这位专家通过网络资源的深入挖掘,如数据发布方的公告、头条新闻或社交媒体动态,来核实异常信息的真伪。
• 机构智库专家:充当资深市场分析师,这位专家运用深厚的领域知识为发现的异常现象提供详尽的背景和阐释。其知识库源自过往分析、数据供应商的交流、历史问题档案及统计方法等。
• 交叉验证专家:专注于利用其他可信来源进行数据对证,这位专家在验证或驳斥已发现的异常中扮演关键角色。即便缺乏完全相同的数据集,专家也能参考趋势相近的数据序列进行分析,比如对比同一市场的不同股票指数或研究相似期限的国债收益率。
比较有意思的是这个管理层讨论:当专家分析汇总为摘要报告后,该报告便提交给一个管理层代理小组。小组成员各司其职,针对报告中的关键发现展开深入审查与讨论。与专注于数据细节的数据专家代理不同,管理层代理被赋予宏观视角,以模拟现实组织中的高层决策过程。这样的设计让战略视角和更宽广的背景得以在决策中发挥作用。代理们在讨论中相互交流观点,辩论不同解读,并评估研究结果的影响。讨论最终达成共识,明确接下来的行动方向。
标普500数据上的应用
接下来,作者通过标普500指数的每日数据序列(1980年至2023年)的案例,实际展示了多智能体AI框架的操作应用。详细阐述了LLM支持的多智能体模型是如何处理和分析真实金融数据的,从发现异常到最终决策的每个环节都进行了阐释。选择标普500指数作为案例研究,意在突出该框架在处理金融数据集复杂性方面的高效能力。
第一步:异常值检测
用Z-Score对标普500指数的涨跌幅数据进行异常值检测。阈值是10个ZScore,以便精确地揪出重大异常值,专注于最突出的偏离情况。
图片
在1987年10月19日、2008年10月13日和2020年3月16日这三个日期(见上图)发现了三个异常值。为了进一步考验框架的识别能力,还故意在数据集中加入了三个缺失值。发现异常后,这些数据点被转换成机器可处理的格式(见下表),为AI代理的后续分析做好了准备。
图片
第二步:数据问题 Agent
当接收到异常数据及其关联的元数据时,负责提出数据问题的专家Agent在验证异常的最初阶段起着至关重要的作用。这位专家提出的问题是多方面的:它们既验证了检测到的异常的本质,也探究了这些异常在历史和市场背景下的重要性,并为进一步核实准备了适合LLM的问题。下表展示了如何指导该专家并让其针对标普500指数中的异常情况进行回答。
图片
图片
第三步:数据专家 Agent
数据专家Agent 1: Web Research
图片
数据专家Agent 2: 机构智库专家
图片
数据专家Agent 3: 交叉验证专家
图片
第四步:报告整合专家 Agent
图片
第五步:管理层讨论
图片
Arxiv[1]
通往 AGI 的神秘代码
if like_this_article():
do_action('点赞')
do_action('再看')
add_wx_friend('iamxxn886')
if like_all_arxiv_articles():
go_to_link('https://github.com/HuggingAGI/HuggingArxiv') star_github_repo(''https://github.com/HuggingAGI/HuggingArxiv')
引用链接
[1]
Arxiv: https://arxiv.org/abs/2403.19735
本文转载自 大语言模型论文跟踪,作者:HuggingAGI