71.4K Star的AI交易团队：多智能体架构如何“炒”出一个华尔街

低调上线却突然爆火出圈，一个无人造势的开源AI项目，为何能横扫GitHub、引爆金融圈？背后多Agent复刻华尔街投研体系的玩法，藏着AI金融落地的全新逻辑。2024年12月28日，一个叫TradingAgents的项目悄悄上线了GitHub。没有发布会，没有融资通稿，没有大V站台。只有一篇挂在arXiv上的学术论文（编号 2412.20138），和一个刚建好的代码仓库。背后的团队叫Tauric Research，总共只有三个公开仓库，社交账号粉丝刚过一千，怎么看都不像会搞出大事的样子。但到了2026年5月初，这个项目拿下了超过71,400颗Star，13,800多次Fork，直接冲上GitHub Python趋势榜第一。其中2026年2月发布的v0.2.0版本引入多提供商支持后增速明显加快，4月底到5月初的一周之内暴涨超过11,000颗Star，24小时内涨了3,315颗——这个增速在开源社区的历史上都不多见。TradingAgents GitHub Star 增长曲线（2024.12 – 2026.5）它做的事情听起来有点“出格”：用多个AI Agent模拟一整个华尔街的投研交易团队，让它们分工协作、多空辩论、风控把关，最后集体拍板做出交易决策。而且，完全开源，一行代码就能跑起来。（项目地址：https://github.com/TauricResearch/TradingAgents）一个投研团队的数字化分身要理解TradingAgents在做什么，先得理解它模仿的对象——真实的对冲基金是怎么运作的。在华尔街，一家像样的对冲基金通常有这么一套运转机制：研究部门负责出报告，投决会上多空分析师互相“抬杠”，交易台根据讨论结果执行策略，风控团队在最后一步把关。一笔交易从立项到执行，中间要经过好几道关卡，环环相扣，没有哪个环节是拍脑袋做出来的。这种流程不是为了折腾人，而是因为金融决策的容错率实在太低了——一次失误可能就是几百万甚至上千万的损失。TradingAgents做的事情，就是把这套运转了几十年的人类组织流程翻译成AI Agent能执行的代码。它把整个交易决策链路拆成了四层，每层对应一个职能团队。第一层是分析师团队，四个人各管一摊。基本面分析师负责评估公司财务表现——利润率、资产回报率、现金流这些硬指标，找内在价值和潜在雷区。舆情分析师盯着社交媒体和论坛，用量化情绪评分算法判断市场短期风向。新闻分析师追踪全球宏观经济事件和政策变动，评估对目标资产的冲击。技术分析师则用MACD、RSI等经典指标识别价格形态和趋势信号。这四个角色各干各的，信息源也完全不同。市场行情数据来自雅虎财经，社交媒体数据来自X和Reddit，新闻数据来自彭博和路透，基本面数据则来自公司财报和内幕交易披露。四根信息管道并行运转，互不干扰，最后各自输出一份结构化的分析报告。从项目展示的分析界面来看，四个分析师的输出不是简单的一段话，而是有明确论点、论据和量化指标的完整分析文档。比如舆情分析师会给出具体的情绪峰值时间和分数，技术分析师会列出关键指标的数值和含义，基本面分析师会按盈利能力、流动性、估值等维度逐项打分。四维分析师团队输出示例（以Apple Inc.为例）第二层是研究员团队，两个角色，一个唱多一个唱空。分析师团队给出的是“证据”，研究员团队负责“判断”。多头研究员拿着分析师的报告找买入的理由，空头研究员拿着同一份报告找卖出的理由，然后两人展开结构化辩论——类似投行里多空分析师的经典对抗。这不是随便吵一架完事。辩论过程有明确的轮次控制，默认两轮，可以自行调整。每一轮辩论都要给出论据和推理逻辑，输出的是经过对抗验证的多空证据链，而不是含糊的“我觉得该买”或者“可能要跌”。多空研究员结构化辩论（左侧Bullish / 右侧Bearish）第三层是交易员Agent。交易员不负责原创分析，它负责汇总和提案。把分析师的证据和研究员的辩论结论压缩成一份交易提案，明确交易方向、时机和仓位大小。这个设计很关键——决策的可追溯性因此有了保障。每一笔交易为什么做、依据是什么、辩论过程中有什么分歧、风控怎么评估的，全链条清晰可查。交易员最终决策输出（BUY Apple Shares）第四层是风控与投资组合经理。风控团队从激进、中性、保守三个维度评估提案的风险敞口，把评估报告交给投资组合经理做最终裁决。经理有权批准、拒绝或者调整方案。只有经过审批的交易指令，才会被发送到模拟交易所执行。风控三角色（Risky / Neutral / Safe）与投资组合经理最终裁决有意思的是，整个系统的推理引擎嵌入了深度推理能力。TradingAgents把深度推理嵌入到了研究员和交易员的决策链路中，让Agent在辩论和提案阶段能进行更深层次的逻辑推演，而不是浅层的信息拼接。TradingAgents 四层架构全景图为什么不是一个Agent搞定所有事看到这里，有人可能会想：为什么不直接找一个最强的模型，给它足够的上下文，让它一口气分析完所有维度然后给个结论？这个想法很直觉，但在金融场景里有几个绕不过去的问题。第一个是信息过载。一个专业的量化分析师每天要处理财报数据、宏观新闻、社交舆情、技术指标、资金流向——多维度信息同时涌入，单一模型的上下文窗口再大，也很难在保证质量的前提下同时处理所有信息。第二个是角色冲突。让同一个模型“同时分析一只股票的多空两面”，听起来合理，实际上模型很难在同一轮推理中既唱多又唱空，还能保持论证的独立性。这就像让一个人自己跟自己辩论，怎么都觉得差点意思。第三个是决策黑箱。单Agent模式下，模型给出“买入”建议时，你很难追溯这个结论是怎么来的。而多Agent架构天然提供了决策审计链——每一层谁说了什么、依据是什么、辩论了几个回合、风控怎么评估的，全都有据可查。TradingAgents的解法很直接：把一个大问题拆成多个小问题，每个小问题由一个“专家”负责，专家之间通过结构化的对抗机制来校准偏差，最终由决策层做综合判断。这不是什么新鲜发明。华尔街的顶级基金一直都是这么运转的——部门分工、专业对抗、层层复核。TradingAgents做的，只是把这个人类流程翻译成了机器能执行的代码。真正聪明的不是架构本身，而是它选对了模仿对象：不是模拟一个交易员的思维，而是模拟一套交易组织的运作机制。上手体验：一行命令跑起来TradingAgents的上手门槛，说一句“几乎为零”不过分。安装就三步：克隆仓库，建Python虚拟环境，运行安装命令。完了。配好任意一个主流大模型的API Key之后，启动交互式命令行，就能看到一个配置界面——选择股票代码、分析日期、模型提供商、辩论轮数这些参数。选好之后回车，各个Agent就开始按流程跑起来了：模型支持方面相当大方。OpenAI的GPT系列、Google的Gemini、Anthropic的Claude、xAI的Grok、DeepSeek、阿里通义千问、智谱GLM，甚至用Ollama在本地跑开源模型都行。企业级用户还能接入Azure OpenAI和AWS Bedrock。一套工厂模式的Provider架构让切换模型变得很简单，每个Provider的原生结构化输出方式被自动适配——比如OpenAI走JSON Schema，Anthropic走工具调用，其他兼容Provider走函数调用。这也意味着，你可以根据成本和性能灵活选择模型，便宜的任务用小模型，复杂的推理用大模型。简单说，只要有任意一个主流大模型的API Key就能跑。不需要GPU，不需要训练模型，不需要标注数据。想用Python直接调用也很方便。核心就是初始化一个图对象，传入股票代码和分析日期，系统自动跑完四层流程返回交易决策。你还可以自定义各种参数——比如用大模型做深度推理、小模型做快速任务，控制辩论轮数，调整风险偏好等等。v0.2.4版本加了一个很有意思的功能：决策记忆。每次分析完成后，决策结果会自动记录到本地日志文件中。下次分析同一只股票时，系统会自动调取历史决策，对比实际收益——包括相对标普500的Alpha收益——然后生成一段反思：“上次为什么对了”“上次为什么错了”。这些经验会被注入到投资组合经理的决策prompt中，让每次分析都站在上一次的肩膀上。这意味着TradingAgents不再是每次从零开始的“无脑机器人”。它具备了某种形式的经验积累能力，分析得越多，沉淀的经验越丰富。新版还支持断点续跑。LangGraph在每个节点保存状态，哪怕跑一半程序崩了或者网络断了，下次启动也能从上次的断点自动恢复，不用重头再来。对于一套跑下来可能消耗不少Token的分析流程来说，这个功能相当实用。另外还有一个容易被忽略的价值：整个分析框架是白盒的。从分析师的数据输入，到研究员的多空辩论，再到交易员的提案和风控的评估，全过程有完整日志输出。你可以清楚地看到每个Agen

查看原文 →

（来源：钛媒体-资讯，2026-05-10）

71.4K Star的AI交易团队：多智能体架构如何“炒”出一个华尔街

相关推荐

评论抢沙发

热门文章

热门标签

支持本站持续更新

如果这篇内容对你有帮助，欢迎扫码支持。

支付宝扫一扫

微信扫一扫

切换注册登录

切换登录注册