A Survey of Reasoning and Agentic Systems in Time Series with Large Language Models


引言

时间序列数据在金融、医疗、能源等领域无处不在,推动了监控、预测和决策等关键应用的发展。然而,许多新兴应用如个性化医疗、自适应风险管理等,要求模型不仅能预测,还能解释其输出、进行因果推理和决策。这突显了时间序列分析对结构化和可靠推理能力的迫切需求。

大型语言模型(LLMs)的出现是一个转折点。它们能够展现逐步推理、阐明因果假设,并与外部工具和环境交互。当被整合到智能体(Agent)系统中时,LLMs获得了规划、反思和持续适应的能力,将时间序列建模从静态预测转变为交互式和解释性的过程。

基于此,本文将时间序列推理(Time Series Reasoning, TSR)定义为:大型语言模型在处理带时间索引的数据时,显式执行结构化推理程序的一类方法,这些方法可能通过多模态上下文和智能体系统得到增强。本文的核心贡献在于:

  1. 提出首个系统性分类体系:围绕推理拓扑(执行结构)和主要目标(任务意图)两个互补的轴线构建,并辅以描述控制流、执行者、模态、知识访问和LLM对齐方案的属性标签。
  2. 提供综合性回顾:不仅分析了研究论文中的方法模式,还对数据集、基准、综述等辅助性工作进行了分类,展示了它们如何支持和塑造时间序列推理领域的发展。
  3. 明确开放性问题:重点指出了在评估、多模态融合、知识增强、长上下文推理、效率、智能体控制以及因果推断等方面的挑战,为该领域的下一阶段研究规划了蓝图。

论文分类体系概览

背景与分类体系

时间序列推理的定义

时间序列推理 (Time Series Reasoning, TSR) 指的是在处理带时间索引的数据时执行显式推理程序的方法。这些方法越来越多地由大型语言模型(LLMs)和多模态LLMs实现,它们能够清晰地表达推理轨迹、与外部工具交互,并作为自主智能体运行。

本文提出的分类体系包含三个互补的组成部分:

  1. 推理拓扑 (Reasoning Topology):指定推理的执行结构。
  2. 主要目标 (Primary Objective):阐明推理过程的主要意图。
  3. 属性标签 (Attribute Tags):描述如控制流、执行者、模态和对齐等辅助属性。

其中,推理拓扑主要目标互斥的:每篇论文根据其核心结构和评估重点,被精确分配一个拓扑和一个目标。相比之下,属性标签非互斥的,一篇论文可以同时拥有多个标签。

按论文类型划分的数量统计

推理拓扑

本文识别出三种互斥的推理拓扑,它们代表了从简单到复杂的推理复杂度谱系:直接推理、线性链式推理和分支结构推理。

推理拓扑图示

直接推理 (Direct Reasoning)

这是最简单的执行形式:单步推理或工具调用,没有任何中间推理轨迹。模型直接从输入跳到输出,例如直接生成预测或分类标签。这种方式效率最高,但可解释性、鲁棒性和处理复杂任务的能力有限,通常作为基线或在对透明度要求不高的场景中使用。

线性链式推理 (Linear Chain Reasoning)

通过引入一系列顺序排列的推理步骤来扩展直接推理。每一步都依赖于前一步的输出,形成一个逻辑进程(例如,分步预测)。这种结构使中间状态变得明确、可观察,从而提供了比直接推理更好的可解释性和模块化。然而,它仅限于单一路径,缺乏探索多重假设的灵活性。

分支结构推理 (Branch-Structured Reasoning)

在这种拓扑中,推理轨迹可以在单次执行中分支成多个路径。分支可能源于模型并行或顺序地探索不同的假设、计划或解释。这使得系统能够进行探索、自适应修正早期步骤、重用中间结果,甚至通过反馈循环或跨分支操作来整合信息。与线性链式推理相比,它更为灵活和强大,但也带来了控制分支增长、处理反馈循环等挑战。

主要目标

主要目标定义了推理过程的最终目的。本文将目标分为四大类,这为比较方法提供了另一个维度:不仅看它们“如何”推理,也看它们“为何”推理。

主要目标的详细分类

传统时间序列分析

涵盖直接建模时间动态的预测性和描述性任务,是时间序列推理的基础。

解释与理解

强调生成人类可解释的见解,而非原始预测。

因果推断与决策

关注于在时间环境中对干预及其结果进行推理。

时间序列生成

关注直接创建或修改时间数据。

属性标签

属性标签是用于捕获额外属性的轻量级、非互斥描述符,分为四类。

控制流操作符

描述推理过程在步骤间的组织方式。

控制流操作符图示

执行智能体

指明在执行过程中负责执行推理步骤的实体。

执行智能体图示

信息源

捕获超出原始时间序列本身的输入。

信息源图示

LLM对齐机制

指定LLM如何被训练或调整以在时间序列任务上执行推理。这是一个分类标签,包含四种机制:

直接推理

直接推理是分类体系中最基本的推理拓扑。在此设置中,模型在单一步骤内将时间序列输入直接映射到输出,而不生成或暴露任何中间推理轨迹。这种方法虽然简单高效,但在可解释性和处理复杂任务方面能力有限。尽管如此,它在近期工作中仍被广泛采用,尤其是在直接的预测、异常检测或描述性问答任务中。

以下是直接推理方法按其主要目标的组织:

传统时间序列分析与直接推理

在这类任务中,模型充当一个单步映射器,将时间输入(可带有附加上下文)转换为预测、类别标签或异常区间等输出。

预测
分类
异常检测
分割

解释与理解与直接推理

这类方法的主要产物是自然语言答案、基本原理或因果解释,它们都是通过单步推理从时间序列中派生出来的。

时间序列问答
解释性诊断

因果推断与决策与直接推理

自主策略学习

直接推理中的属性标签

线性链式推理

线性链式推理表示执行过程遵循一个单一、有序的步骤序列,并且在轨迹中没有分支。模型可以显式分解任务、调用一次工具或检索,并可选地执行一次性的验证,但它不会维护多个并发的假设或进行“批判-修正”的迭代循环。这种拓扑结构在保留直接推理大部分简单性的同时,增加了一些温和的结构,可以改善基础和数值稳定性,同时仍然避免了分支结构系统的延迟和复杂性。

以下是线性链式方法按其主要目标的组织:

传统时间序列分析与线性链式推理

在线性链式推理下进行传统的时间序列分析,通常会实现一个脚本化的序列,如“分析 → (检索) → 预测”或“检测 → 验证 → 决策”,同时保持单一路径执行。

预测
分类