GoAgent: Group-of-Agents Communication Topology Generation for LLM-based Multi-Agent Systems

GoAgent：让AI Agent学会“抱团”，准确率93.8%，Token成本降低17%

单个AI Agent的能力再强，也难解复杂任务。于是，多智能体系统（Multi-Agent Systems, MAS）应运而生，通过让多个Agent协作来解决问题。但一个核心挑战随之而来：如何组织这些Agent才能最高效？

ArXiv URL：http://arxiv.org/abs/2603.19677v1

目前的多数方法都像是在一个个地拉人入伙，再逐一确定谁跟谁对话。这种“以节点为中心”的模式，往往导致协作流程混乱、沟通成本高昂。

现在，一篇名为GoAgent的论文提出了一个颠覆性的想法：别再单点连线了，直接“成组”干活！该研究将预先定义的“协作小组”作为基本构建单元，不仅显著提升了复杂任务的解决能力，还顺便把Token消耗降低了约17%。

传统方法构建通信网络时，一次只考虑一个Agent，这被称为节点中心（node-centric）范式。这种方式的弊端显而易见：它无法从宏观上把握任务所需的协作结构，容易产生不必要的沟通，甚至导致关键角色缺失。

图1：(a) 节点中心范式 vs (b) GoAgent的群组中心范式

GoAgent则开创了群组中心（group-centric）的新范式。它不再将单个Agent视为原子，而是将“协作群组”作为构建通信拓扑的基本单位。

一个群组可能包含“问题分解师”、“代码实现者”和“代码审查员”，内部已经形成了高效的工作流。模型只需要决定在当前任务中需要哪些群组，以及这些群组之间如何传递信息。

这种方式的好处是双重的：

图2：GoAgent整体架构概览

GoAgent的整个工作流程可以分为几个关键步骤：首先，对任务进行编码并发现候选的协作群组；然后，通过自回归的方式一步步选择并连接这些群组；最后，利用一个巧妙的机制来压缩通信中的噪音。

GoAgent生成通信拓扑的过程，就像一位聪明的项目经理在组建团队。

首先，研究者利用GPT-4等大语言模型，根据特定领域（如代码生成、数学推理）的需求，预先生成一系列候选的“专家群组”。

每个群组都有明确的定义，包括：

这些候选群组构成了一个“人才库”，等待被调用。

接下来，GoAgent的核心生成模型开始工作。它会一步步地构建最终的通信图：

在每一步 $t$，模型会做两件事：

这个过程是自回归（autoregressive）的，意味着每一步的决策都依赖于之前的状态，直到模型生成一个特殊的 $END$ 标志，表示图构建完成。

随着协作图的不断扩大，Agent之间的历史对话会变得越来越冗长，其中必然夹杂着大量与当前决策无关的“噪音”。如果任由这些噪音传播，不仅会增加Token消耗，还可能干扰后续Agent的判断。

为了解决这个问题，GoAgent引入了一个关键机制——条件信息瓶颈（Conditional Information Bottleneck, CIB）。

你可以把它想象成一个智能过滤器。在每次进行群组或连接预测之前，历史信息都会先经过CIB层。CIB的目标是：

其优化目标可以表示为：

\[\min\mathcal{L}_{\text{CIB}}=-I(\mathbf{c};y \mid \mathbf{z}_{\mathcal{Q}})+\beta I(\mathbf{x};\mathbf{c} \mid \mathbf{z}_{\mathcal{Q}})\]

这里，$y$ 是预测目标（下一个群组或连接），$\mathbf{x}$ 是原始的历史信息，$\mathbf{c}$ 是被压缩后的精华信息，而 $\mathbf{z}_{\mathcal{Q}}$ 则是任务本身的表示。

第一项（Predictive Term）确保压缩后的信息足以做出准确预测，第二项（Compression Term）则负责尽可能地丢弃无关信息。通过这种方式，GoAgent确保了每一步决策都是基于最精炼、最相关的信号，从而提升了整个系统的效率和鲁棒性。

GoAgent的表现在六个主流基准测试（包括MMLU、GSM8K和HumanEval等）上都非常出色，证明了其有效性。

1. 准确率全面领先

从下方的汇总表格可以看出，GoAgent在所有任务上均达到了SOTA水平，平均准确率高达93.84%。尤其在MMLU（常识推理）和HumanEval（代码生成）这类更复杂的任务上，其优势更为明显，相较于之前的SOTA方法分别提升了1.96%和2.47%。

这印证了该研究的核心假设：以群组为单位进行构建，能够形成更连贯、更专业的协作流，从而更好地解决复杂问题。

2. Token消耗显著降低

效率是衡量多智能体系统好坏的另一个关键指标。如下图所示，GoAgent在实现更高准确率的同时，还成功将Token消耗降低了约17%。

图3：Token消耗对比

这主要归功于两个方面：一是群组化的结构避免了大量冗余的单点通信；二是CIB机制有效过滤了历史噪音，减少了传递给LLM的上下文长度。

消融实验进一步证实，无论是“群组中心”的设计还是“CIB”机制，两者对于最终的性能提升都至关重要，缺一不可。

GoAgent的提出，为设计高效、强大的多智能体系统开辟了一条新路。它成功地将构建范式从混乱的“节点中心”提升到了有序的“群组中心”，通过模拟现实世界中的团队协作模式，让AI Agent学会了“抱团”作战。

更准确、更经济，GoAgent证明了优秀的顶层设计比单纯堆砌Agent能力更为重要。未来，我们或许会看到更多基于这种“组织架构学”思想的AI协作系统诞生。