Supporting Our AI Overlords: Redesigning Data Systems to be Agent-First


TL;DR

本文指出,未来的数据系统将主要服务于由大型语言模型(LLM)驱动的智能体,并提出了一种“智能体优先”(agent-first)的数据系统新架构,以高效处理智能体工作负载中普遍存在的高吞吐量、异构、冗余和可引导的“智能体推测”(agentic speculation)过程。

关键定义

相关工作

当前的数据系统主要为两种工作负载设计:由人类驱动的、较为间歇的分析查询,或由终端应用程序驱动的、目标明确的请求。然而,随着大型语言模型(LLM)变得越来越强大和廉价,由LLM智能体代表用户操作数据将成为主导性的工作负载。

这些智能体虽然推理能力强,但缺乏对底层数据和系统特性的先天“根基”。它们通过不知疲倦地尝试各种可能性来弥补这一点,这一过程被称为“智能体推测”。这种推测行为会产生巨大规模、高度冗余且效率低下的查询,对现有数据系统构成了巨大挑战,现有系统并未针对这种工作负载进行优化,其巨大的规模和低效性将成为性能瓶颈。

本文旨在解决的核心问题是:如何重新设计数据系统,使其能够原生且高效地支持智能体工作负载,特别是“智能体推测”过程,从而帮助LLM智能体更高效地确定最佳行动方案。

本文方法

本文提出了一种“智能体优先”的数据系统架构愿景,其核心创新在于改变了数据系统与用户(智能体)的交互范式,从被动响应查询转变为主动引导和协同优化。

智能体优先的数据系统架构

该架构的核心组件如下图所示,旨在利用智能体推测的四大特性:规模性(scale)、异构性(heterogeneity)、冗余性(redundancy)和可引导性(steerability)。

Agent-First Data Systems Architecture

该架构主要包括:

  1. 查询接口:智能体发出“探针”(Probes),其中包含SQL以及描述意图和需求的“简报”(Briefs)。系统不仅返回答案,还通过“睡眠智能体”(sleeper agents)主动提供“根基反馈”(grounding feedback)来引导智能体。
  2. 探针解释与优化器:系统内的“智能体解释器”(Agentic Interpreter)解析探针和简报。而后,“探针优化器”(Probe Optimizer)的目标不再是完美执行每个查询,而是“满意化”(satisfice),即在满足智能体当前步骤需求的前提下,通过近似查询处理(Approximate Query Processing)和多查询优化(Multi-query Optimization)等技术,最小化总处理时间。
  3. 存储与事务层:引入“智能体记忆存储”(Agentic Memory Store)作为语义缓存,保存探索成果。同时,设计了新的“共享事务管理器”(Shared Transaction Manager),以高效处理多分支、高冗余的假设性更新(what-if updates),支持大规模并行分叉和快速回滚。

创新点

本文方法与传统数据系统的本质区别在于,它将智能体视作一等公民,并围绕其工作特性进行全新设计。

查询接口

探针处理与优化

索引、存储与事务

实验结论

本文通过两个案例研究验证了“智能体推测”工作负载的关键特性,并证明了其设计理念的合理性。

BIRD数据集上的成功率 (a) 成功率 vs. 尝试次数 (K)

BIRD数据集上的成功率 vs. 交互轮次 (b) 成功率 vs. 交互轮次

子表达式的冗余性 (a) 按子表达式大小

子表达式按根操作的冗余性 (b) 按根操作类型

智能体活动热力图

图3. 智能体活动热力图,显示了从探索到构建的阶段性特征。
活动 平均次数 (无提示) 平均次数 (有提示) 减少比例 (%)
探索表 3.44 2.95 -14.2
探索特定列 3.56 2.57 -27.7
尝试部分查询 4.28 2.71 -36.6
尝试完整查询 1.26 1.05 -16.6
所有SQL查询 12.67 10.38 -18.1
表1. 提供提示前后,智能体平均活动次数对比。

最终结论:实验结果有力地证明了智能体工作负载具有规模性、冗余性、异构性和可引导性等独特特征。这些特征使得现有数据系统难以高效应对,同时也为新一代“智能体优先”的数据系统架构提供了明确的优化方向和机遇。