Are Agents Just Automata? On the Formal Equivalence Between Agentic AI and the Chomsky Hierarchy


TL;DR

本文通过将智能体(Agent)的内存架构与乔姆斯基层级(Chomsky hierarchy)中的抽象机进行类比,建立了一套形式化等价框架,指出智能体的计算能力和可验证性由其内存类型(无内存、堆栈、无限读写内存)决定,从而为设计更高效、更安全的智能体系统提供了理论基础和工程指导。

关键定义

相关工作

当前,主流的智能体AI系统,如 ReAct 和 StateFlow,通常围绕一个“感知-规划-行动”(Sense-Plan-Act) 循环构建,并利用大语言模型 (LLM) 作为其决策核心。这些系统本质上是状态转移机器。尽管已有研究将模型检查 (model-checking)、线性时序逻辑 (Linear Temporal Logic, LTL) 等形式化方法应用于AI系统以增强其可靠性,但整个领域仍存在一个关键瓶颈。

目前缺乏一个统一的理论框架,来根据智能体的计算能力对其进行分类。这导致在设计上倾向于采用默认的“一刀切”模式,即赋予智能体图灵完备 (Turing-complete, TC) 的能力,即使任务本身远不需要如此高的复杂度。这种做法不仅导致系统效率低下、成本高昂,更严重的是,由于其理论上的不可判定性 (undecidability),使得对智能体行为的形式化验证变得极为困难甚至不可能。

本文旨在解决这一问题,通过建立智能体架构与其底层计算模型之间的形式化联系,为智能体设计提供一种更具原则性的方法。

本文方法

本文的核心思想是:一个AI智能体的计算能力、可验证性和行为边界,从根本上是由其内存架构决定的。基于此,本文通过将不同内存复杂度的智能体映射到乔姆斯基层级中对应的自动机,构建了一个形式化的分类框架。

分类体系

本文将智能体划分为三个主要类别,并证明了它们与经典计算模型的等价性。

正则智能体 (Regular Agents) $\simeq$ 有限自动机 (Finite Automata, FA)

这类智能体的内存是有限且大小恒定的。其行为被严格限制在一个预先定义好的有限状态图中。即使使用LLM来决策,LLM也只能扮演一个“转移神谕”(transition oracle) 的角色,即在图中已有的状态转移路径中进行选择,而不能创造新的状态或访问外部持久化内存。

上下文无关智能体 (Context-Free Agents) $\simeq$ 下推自动机 (Pushdown Automata, PDA)

这类智能体在有限状态控制的基础上,增加了一个堆栈(后进先出 LIFO)内存。这个堆栈结构使其能够自然地处理层级化的任务分解和嵌套的子目标。例如,当一个智能体为了完成一个大任务(“发布产品”)而生成一系列子任务(“设计”、“开发”、“测试”)时,它会将这些子任务“压入”堆栈;每完成一个,就将其“弹出”,返回到上层任务。

图灵完备智能体 (TC Agents) $\simeq$ 图灵机 (Turing Machines, TM)

这类智能体被授予访问一个无界的、可任意读写的内存,这类似于图灵机的“纸带”。这个内存可以是一个“草稿纸”文件、一个可无限扩展的向量数据库,或任何能被智能体自由修改和查询的外部存储。

对多智能体系统的扩展

本文的框架同样适用于多智能体系统 (Multi-Agent Systems, MAS)。一个由多个正则智能体组成的系统,其整体行为等效于一个状态数量巨大但仍然是有限的单一状态机。然而,当这些简单的智能体被赋予访问一个共享的、无界的读写内存时,整个系统就发生了质变,其计算能力跃升至通用图灵机级别。

工程原则:适当规模化 (Right-Sizing)

基于上述分类,本文提出了适当规模化的核心工程原则:为任务选择满足需求的、计算能力最弱的智能体类别。这不仅能优化成本和延迟,更重要的是能在设计阶段就明确系统的能力边界和可验证性。

为了指导实践,本文提供了一个决策流程图来帮助开发者选择合适的智能体架构。

决策流程图

同时,本文还将当前流行的智能体框架映射到了这个分类体系中。

智能体框架与计算类别的映射

实验结论

本文是一篇理论研究,未包含传统的数值实验,其结论是基于形式化推导和理论分析得出的。