GoAgent: Group-of-Agents Communication Topology Generation for LLM-based Multi-Agent Systems
GoAgent:让AI Agent学会“抱团”,准确率93.8%,Token成本降低17%

单个AI Agent的能力再强,也难解复杂任务。于是,多智能体系统(Multi-Agent Systems, MAS)应运而生,通过让多个Agent协作来解决问题。但一个核心挑战随之而来:如何组织这些Agent才能最高效?
ArXiv URL:http://arxiv.org/abs/2603.19677v1
目前的多数方法都像是在一个个地拉人入伙,再逐一确定谁跟谁对话。这种“以节点为中心”的模式,往往导致协作流程混乱、沟通成本高昂。
现在,一篇名为GoAgent的论文提出了一个颠覆性的想法:别再单点连线了,直接“成组”干活!该研究将预先定义的“协作小组”作为基本构建单元,不仅显著提升了复杂任务的解决能力,还顺便把Token消耗降低了约17%。
从“单兵作战”到“团队协作”:GoAgent的新范式
传统方法构建通信网络时,一次只考虑一个Agent,这被称为节点中心(node-centric)范式。这种方式的弊端显而易见:它无法从宏观上把握任务所需的协作结构,容易产生不必要的沟通,甚至导致关键角色缺失。

图1:(a) 节点中心范式 vs (b) GoAgent的群组中心范式
GoAgent则开创了群组中心(group-centric)的新范式。它不再将单个Agent视为原子,而是将“协作群组”作为构建通信拓扑的基本单位。
一个群组可能包含“问题分解师”、“代码实现者”和“代码审查员”,内部已经形成了高效的工作流。模型只需要决定在当前任务中需要哪些群组,以及这些群组之间如何传递信息。
这种方式的好处是双重的:
-
保证内部凝聚力:群组内部的协作模式是预先定义好的,确保了子任务的高效执行。
-
简化宏观协调:模型只需关注更高层级的群组间依赖关系,大大降低了构建的复杂度。

图2:GoAgent整体架构概览
GoAgent的整个工作流程可以分为几个关键步骤:首先,对任务进行编码并发现候选的协作群组;然后,通过自回归的方式一步步选择并连接这些群组;最后,利用一个巧妙的机制来压缩通信中的噪音。
GoAgent如何构建“精英团队”?
GoAgent生成通信拓扑的过程,就像一位聪明的项目经理在组建团队。
1. 协作群组发现
首先,研究者利用GPT-4等大语言模型,根据特定领域(如代码生成、数学推理)的需求,预先生成一系列候选的“专家群组”。
每个群组都有明确的定义,包括:
-
名称:如“代码调试小组”
-
专长:识别并修复代码中的逻辑错误
-
角色:包含“代码审查员”、“语法检查器”、“逻辑验证器”等Agent
-
内部拓扑:定义组内Agent的协作方式,如“顺序流水线”或“全连接讨论”
这些候选群组构成了一个“人才库”,等待被调用。
2. 自回归群组生成
接下来,GoAgent的核心生成模型开始工作。它会一步步地构建最终的通信图:
在每一步 $t$,模型会做两件事:
-
群组预测:基于当前任务需求和已生成的图结构 $\mathcal{G}_{<t}$,从“人才库”中选择下一个最合适的群组 $M_t$。
-
连接预测:决定新加入的群组 $M_t$ 应该从哪些已存在的群组 $M_i$ 接收信息,从而建立跨组的通信连接。
这个过程是自回归(autoregressive)的,意味着每一步的决策都依赖于之前的状态,直到模型生成一个特殊的 \(END\) 标志,表示图构建完成。
拒绝“七嘴八舌”:用信息瓶颈压缩通信
随着协作图的不断扩大,Agent之间的历史对话会变得越来越冗长,其中必然夹杂着大量与当前决策无关的“噪音”。如果任由这些噪音传播,不仅会增加Token消耗,还可能干扰后续Agent的判断。
为了解决这个问题,GoAgent引入了一个关键机制——条件信息瓶颈(Conditional Information Bottleneck, CIB)。
你可以把它想象成一个智能过滤器。在每次进行群组或连接预测之前,历史信息都会先经过CIB层。CIB的目标是:
-
保留:与当前任务(Condition)最相关的信息。
-
压缩:与任务无关的、冗余的历史噪音。
其优化目标可以表示为:
\[\min\mathcal{L}_{\text{CIB}}=-I(\mathbf{c};y \mid \mathbf{z}_{\mathcal{Q}})+\beta I(\mathbf{x};\mathbf{c} \mid \mathbf{z}_{\mathcal{Q}})\]这里,$y$ 是预测目标(下一个群组或连接),$\mathbf{x}$ 是原始的历史信息,$\mathbf{c}$ 是被压缩后的精华信息,而 $\mathbf{z}_{\mathcal{Q}}$ 则是任务本身的表示。
第一项(Predictive Term)确保压缩后的信息足以做出准确预测,第二项(Compression Term)则负责尽可能地丢弃无关信息。通过这种方式,GoAgent确保了每一步决策都是基于最精炼、最相关的信号,从而提升了整个系统的效率和鲁棒性。
实验效果:更准、更省
GoAgent的表现在六个主流基准测试(包括MMLU、GSM8K和HumanEval等)上都非常出色,证明了其有效性。
1. 准确率全面领先
从下方的汇总表格可以看出,GoAgent在所有任务上均达到了SOTA水平,平均准确率高达93.84%。尤其在MMLU(常识推理)和HumanEval(代码生成)这类更复杂的任务上,其优势更为明显,相较于之前的SOTA方法分别提升了1.96%和2.47%。
这印证了该研究的核心假设:以群组为单位进行构建,能够形成更连贯、更专业的协作流,从而更好地解决复杂问题。
2. Token消耗显著降低
效率是衡量多智能体系统好坏的另一个关键指标。如下图所示,GoAgent在实现更高准确率的同时,还成功将Token消耗降低了约17%。

图3:Token消耗对比
这主要归功于两个方面:一是群组化的结构避免了大量冗余的单点通信;二是CIB机制有效过滤了历史噪音,减少了传递给LLM的上下文长度。
消融实验进一步证实,无论是“群组中心”的设计还是“CIB”机制,两者对于最终的性能提升都至关重要,缺一不可。
结语
GoAgent的提出,为设计高效、强大的多智能体系统开辟了一条新路。它成功地将构建范式从混乱的“节点中心”提升到了有序的“群组中心”,通过模拟现实世界中的团队协作模式,让AI Agent学会了“抱团”作战。
更准确、更经济,GoAgent证明了优秀的顶层设计比单纯堆砌Agent能力更为重要。未来,我们或许会看到更多基于这种“组织架构学”思想的AI协作系统诞生。