Tutorials

每日AI最新进展分享。

FLEx: Language Modeling with Few-shot Language Explanations

2 min read · March 29, 2026

2026
Fine-tuning Small Language Models as Efficient Enterprise Search Relevance Labelers

2 min read · March 29, 2026

2026
Fast-weight Product Key Memory

2 min read · March 29, 2026

2026
Exploration v.s. Exploitation: Rethinking RLVR through Clipping, Entropy, and Spurious Reward

1 min read · March 29, 2026

2026
Excess Description Length of Learning Generalizable Predictors

2 min read · March 29, 2026

2026
EvoRoute: Experience-Driven Self-Routing LLM Agent Systems

2 min read · March 29, 2026

2026
EvoClaw: Evaluating AI Agents on Continuous Software Evolution

2 min read · March 29, 2026

2026
Evaluating Parameter Efficient Methods for RLVR

1 min read · March 29, 2026

2026
Epistemological Fault Lines Between Human and Artificial Intelligence

1 min read · March 29, 2026

2026
Enhancing LLM Planning Capabilities through Intrinsic Self-Critique

1 min read · March 29, 2026

2026
End-to-End Test-Time Training for Long Context

2 min read · March 29, 2026

2026
Emergent Introspective Awareness in Large Language Models

1 min read · March 29, 2026

2026
ELLA: Efficient Lifelong Learning for Adapters in Large Language Models

2 min read · March 29, 2026

2026
Digital Twin AI: Opportunities and Challenges from Large Language Models to World Models

1 min read · March 29, 2026

2026
Deep Delta Learning

1 min read · March 29, 2026

2026
Decide Then Retrieve: A Training-Free Framework with Uncertainty-Guided Triggering and Dual-Path Retrieval

1 min read · March 29, 2026

2026
DataFlow: An LLM-Driven Framework for Unified Data Preparation and Workflow Automation in the Era of Data-Centric AI

2 min read · March 29, 2026

2026
CRoPE: Efficient Parametrization of Rotary Positional Embedding

2 min read · March 29, 2026

2026
Context-Free Recognition with Transformers

2 min read · March 29, 2026

2026
CoMeT: Collaborative Memory Transformer for Efficient Long Context Modeling

1 min read · March 29, 2026

2026
CogMem: A Cognitive Memory Architecture for Sustained Multi-Turn Reasoning in Large Language Models

2 min read · March 29, 2026

2026
CogFlow: Bridging Perception and Reasoning through Knowledge Internalization for Visual Mathematical Problem Solving

1 min read · March 29, 2026

2026
Citation-Grounded Code Comprehension: Preventing LLM Hallucination Through Hybrid Retrieval and Graph-Augmented Context

2 min read · March 29, 2026

2026
CaveAgent: Transforming LLMs into Stateful Runtime Operators

1 min read · March 29, 2026

2026
Can LLMs Track Their Output Length? A Dynamic Feedback Mechanism for Precise Length Regulation

1 min read · March 29, 2026

2026
Broken Words, Broken Performance: Effect of Tokenization on Performance of LLMs

1 min read · March 29, 2026

2026
Beyond the Black Box: Theory and Mechanism of Large Language Models

2 min read · March 29, 2026

2026
Beyond Gemini-3-Pro: Revisiting LLM Routing and Aggregation at Scale

1 min read · March 29, 2026

2026
Autoregressive Language Models are Secretly Energy-Based Models: Insights into the Lookahead Capabilities of Next-Token Prediction

2 min read · March 29, 2026

2026
An Information Theoretic Perspective on Agentic System Design

2 min read · March 29, 2026

2026
An Information-Theoretic Framework for Robust Large Language Model Editing

1 min read · March 29, 2026

2026
An Empirical Study on Noisy Data and LLM Pretraining Loss Divergence

1 min read · March 29, 2026

2026
An Empirical Study of SFT-DPO Interaction and Parameterization in Small Language Models

1 min read · March 29, 2026

2026
AI Meets Brain: Memory Systems from Cognitive Neuroscience to Autonomous Agents

1 min read · March 29, 2026

2026
AI Agent Systems: Architectures, Applications, and Evaluation

2 min read · March 29, 2026

2026
Agentic Memory: Learning Unified Long-Term and Short-Term Memory Management for Large Language Model Agents

1 min read · March 29, 2026

2026
Adaptation of Agentic AI

2 min read · March 29, 2026

2026
Accurate Table Question Answering with Accessible LLMs

1 min read · March 29, 2026

2026
Accelerate Speculative Decoding with Sparse Computation in Verification

2 min read · March 29, 2026

2026
A Unified Definition of Hallucination, Or: It's the World Model, Stupid

2 min read · March 29, 2026

2026
A Survey of Weight Space Learning: Understanding, Representation, and Generation

2 min read · March 29, 2026

2026
A Survey of Reasoning in Autonomous Driving Systems: Open Challenges and Emerging Paradigms

1 min read · March 29, 2026

2026
A Subgoal-driven Framework for Improving Long-Horizon LLM Agents

1 min read · March 29, 2026

2026
A model of errors in transformers

1 min read · March 29, 2026

2026
A Component-Based Survey of Interactions between Large Language Models and Multi-Armed Bandits

1 min read · March 29, 2026

2026
A Comedy of Estimators: On KL Regularization in RL Training of LLMs

3 min read · March 29, 2026

2026
Zero-Shot Performance Prediction for Probabilistic Scaling Laws

4 min read · March 29, 2026

2026
xLLM Technical Report

2 min read · March 29, 2026

2026
WizardCoder: Empowering Code Large Language Models with Evol-Instruct

3 min read · March 29, 2026

2026
Why Low-Precision Transformer Training Fails: An Analysis on Flash Attention

3 min read · March 29, 2026

2026