GoAgent: Group-of-Agents Communication Topology Generation for LLM-based Multi-Agent Systems

GoAgent:让AI Agent学会“抱团”,准确率93.8%,Token成本降低17%

单个AI Agent的能力再强,也难解复杂任务。于是,多智能体系统Multi-Agent Systems, MAS)应运而生,通过让多个Agent协作来解决问题。但一个核心挑战随之而来:如何组织这些Agent才能最高效?

ArXiv URL:http://arxiv.org/abs/2603.19677v1

目前的多数方法都像是在一个个地拉人入伙,再逐一确定谁跟谁对话。这种“以节点为中心”的模式,往往导致协作流程混乱、沟通成本高昂。

现在,一篇名为GoAgent的论文提出了一个颠覆性的想法:别再单点连线了,直接“成组”干活!该研究将预先定义的“协作小组”作为基本构建单元,不仅显著提升了复杂任务的解决能力,还顺便把Token消耗降低了约17%。

从“单兵作战”到“团队协作”:GoAgent的新范式

传统方法构建通信网络时,一次只考虑一个Agent,这被称为节点中心node-centric)范式。这种方式的弊端显而易见:它无法从宏观上把握任务所需的协作结构,容易产生不必要的沟通,甚至导致关键角色缺失。

Refer to caption

图1:(a) 节点中心范式 vs (b) GoAgent的群组中心范式

GoAgent则开创了群组中心group-centric)的新范式。它不再将单个Agent视为原子,而是将“协作群组”作为构建通信拓扑的基本单位。

一个群组可能包含“问题分解师”、“代码实现者”和“代码审查员”,内部已经形成了高效的工作流。模型只需要决定在当前任务中需要哪些群组,以及这些群组之间如何传递信息。

这种方式的好处是双重的:

  1. 保证内部凝聚力:群组内部的协作模式是预先定义好的,确保了子任务的高效执行。

  2. 简化宏观协调:模型只需关注更高层级的群组间依赖关系,大大降低了构建的复杂度。

Refer to caption

图2:GoAgent整体架构概览

GoAgent的整个工作流程可以分为几个关键步骤:首先,对任务进行编码并发现候选的协作群组;然后,通过自回归的方式一步步选择并连接这些群组;最后,利用一个巧妙的机制来压缩通信中的噪音。

GoAgent如何构建“精英团队”?

GoAgent生成通信拓扑的过程,就像一位聪明的项目经理在组建团队。

1. 协作群组发现

首先,研究者利用GPT-4等大语言模型,根据特定领域(如代码生成、数学推理)的需求,预先生成一系列候选的“专家群组”。

每个群组都有明确的定义,包括:

这些候选群组构成了一个“人才库”,等待被调用。

2. 自回归群组生成

接下来,GoAgent的核心生成模型开始工作。它会一步步地构建最终的通信图:

在每一步 $t$,模型会做两件事:

这个过程是自回归autoregressive)的,意味着每一步的决策都依赖于之前的状态,直到模型生成一个特殊的 \(END\) 标志,表示图构建完成。

拒绝“七嘴八舌”:用信息瓶颈压缩通信

随着协作图的不断扩大,Agent之间的历史对话会变得越来越冗长,其中必然夹杂着大量与当前决策无关的“噪音”。如果任由这些噪音传播,不仅会增加Token消耗,还可能干扰后续Agent的判断。

为了解决这个问题,GoAgent引入了一个关键机制——条件信息瓶颈Conditional Information Bottleneck, CIB)。

你可以把它想象成一个智能过滤器。在每次进行群组或连接预测之前,历史信息都会先经过CIB层。CIB的目标是:

其优化目标可以表示为:

\[\min\mathcal{L}_{\text{CIB}}=-I(\mathbf{c};y \mid \mathbf{z}_{\mathcal{Q}})+\beta I(\mathbf{x};\mathbf{c} \mid \mathbf{z}_{\mathcal{Q}})\]

这里,$y$ 是预测目标(下一个群组或连接),$\mathbf{x}$ 是原始的历史信息,$\mathbf{c}$ 是被压缩后的精华信息,而 $\mathbf{z}_{\mathcal{Q}}$ 则是任务本身的表示。

第一项(Predictive Term)确保压缩后的信息足以做出准确预测,第二项(Compression Term)则负责尽可能地丢弃无关信息。通过这种方式,GoAgent确保了每一步决策都是基于最精炼、最相关的信号,从而提升了整个系统的效率和鲁棒性。

实验效果:更准、更省

GoAgent的表现在六个主流基准测试(包括MMLU、GSM8K和HumanEval等)上都非常出色,证明了其有效性。

1. 准确率全面领先

从下方的汇总表格可以看出,GoAgent在所有任务上均达到了SOTA水平,平均准确率高达93.84%。尤其在MMLU(常识推理)和HumanEval(代码生成)这类更复杂的任务上,其优势更为明显,相较于之前的SOTA方法分别提升了1.96%和2.47%。

这印证了该研究的核心假设:以群组为单位进行构建,能够形成更连贯、更专业的协作流,从而更好地解决复杂问题。

2. Token消耗显著降低

效率是衡量多智能体系统好坏的另一个关键指标。如下图所示,GoAgent在实现更高准确率的同时,还成功将Token消耗降低了约17%。

Refer to caption

图3:Token消耗对比

这主要归功于两个方面:一是群组化的结构避免了大量冗余的单点通信;二是CIB机制有效过滤了历史噪音,减少了传递给LLM的上下文长度。

消融实验进一步证实,无论是“群组中心”的设计还是“CIB”机制,两者对于最终的性能提升都至关重要,缺一不可。

结语

GoAgent的提出,为设计高效、强大的多智能体系统开辟了一条新路。它成功地将构建范式从混乱的“节点中心”提升到了有序的“群组中心”,通过模拟现实世界中的团队协作模式,让AI Agent学会了“抱团”作战。

更准确、更经济,GoAgent证明了优秀的顶层设计比单纯堆砌Agent能力更为重要。未来,我们或许会看到更多基于这种“组织架构学”思想的AI协作系统诞生。