Tutorials

每日AI最新进展分享。

Why Less is More (Sometimes): A Theory of Data Curation

3 min read · March 29, 2026

2026
Who Said Neural Networks Aren't Linear?

3 min read · March 29, 2026

2026
What's the next frontier for Data-centric AI? Data Savvy Agents

2 min read · March 29, 2026

2026
What Limits Agentic Systems Efficiency?

2 min read · March 29, 2026

2026
What is the objective of reasoning with reinforcement learning?

2 min read · March 29, 2026

2026
Weight-sparse transformers have interpretable circuits

1 min read · March 29, 2026

2026
WebWeaver: Structuring Web-Scale Evidence with Dynamic Outlines for Open-Ended Deep Research

4 min read · March 29, 2026

2026
Webscale-RL: Automated Data Pipeline for Scaling RL Data to Pretraining Levels

2 min read · March 29, 2026

2026
Voyager: An Open-Ended Embodied Agent with Large Language Models

4 min read · March 29, 2026

2026
Vision Mamba: Efficient Visual Representation Learning with Bidirectional State Space Model

4 min read · March 29, 2026

2026
Virtual Width Networks

1 min read · March 29, 2026

2026
Virtual Agent Economies

1 min read · March 29, 2026

2026
VideoAgentTrek: Computer Use Pretraining from Unlabeled Videos

3 min read · March 29, 2026

2026
VibeVoice Technical Report

4 min read · March 29, 2026

2026
VerlTool: Towards Holistic Agentic Reinforcement Learning with Tool Use

5 min read · March 29, 2026

2026
Valid Survey Simulations with Limited Human Data: The Roles of Prompting, Fine-Tuning, and Rectification

5 min read · March 29, 2026

2026
Unlocking the Power of Multi-Agent LLM for Reasoning: From Lazy Agents to Deliberation

2 min read · March 29, 2026

2026
Unifying Tree Search Algorithm and Reward Design for LLM Reasoning: A Survey

3 min read · March 29, 2026

2026
Unifying Large Language Models and Knowledge Graphs: A Roadmap

6 min read · March 29, 2026

2026
UNIFORM: Unifying Knowledge from Large-scale and Diverse Pre-trained Models

4 min read · March 29, 2026

2026
Understanding the Role of Training Data in Test-Time Scaling

2 min read · March 29, 2026

2026
Understanding Robustness of Model Editing in Code LLMs: An Empirical Study

3 min read · March 29, 2026

2026
Understanding R1-Zero-Like Training: A Critical Perspective

4 min read · March 29, 2026

2026
Uncovering Scaling Laws for Large Language Models via Inverse Problems

2 min read · March 29, 2026

2026
UI-TARS-2 Technical Report: Advancing GUI Agent with Multi-Turn Reinforcement Learning

1 min read · March 29, 2026

2026
TreeGRPO: Tree-Advantage GRPO for Online RL Post-Training of Diffusion Models

1 min read · March 29, 2026

2026
Tree Training: Accelerating Agentic LLMs Training via Shared Prefix Reuse

3 min read · March 29, 2026

2026
Tree Search for LLM Agent Reinforcement Learning

4 min read · March 29, 2026

2026
Tree of Thoughts: Deliberate Problem Solving with Large Language Models

3 min read · March 29, 2026

2026
Transition Models: Rethinking the Generative Learning Objective

5 min read · March 29, 2026

2026
Transformers are SSMs: Generalized Models and Efficient Algorithms Through Structured State Space Duality

3 min read · March 29, 2026

2026
Transformer Enhanced Relation Classification: A Comparative Analysis of Contextuality, Data Efficiency and Sequence Complexity

2 min read · March 29, 2026

2026
Training Task Reasoning LLM Agents for Multi-turn Task Planning via Single-turn Reinforcement Learning

3 min read · March 29, 2026

2026
Train on Validation (ToV): Fast data selection with applications to fine-tuning

3 min read · March 29, 2026

2026
Train for Truth, Keep the Skills: Binary Retrieval-Augmented Reward Mitigates Hallucinations

4 min read · March 29, 2026

2026
Towards Unbiased Calibration using Meta-Regularization

3 min read · March 29, 2026

2026
Towards Flash Thinking via Decoupled Advantage Policy Optimization

4 min read · March 29, 2026

2026
Towards a Unified View of Large Language Model Post-Training

5 min read · March 29, 2026

2026
Towards a Science of Scaling Agent Systems

1 min read · March 29, 2026

2026
TOUCAN: Synthesizing 1.5M Tool-Agentic Data from Real-World MCP Environments

5 min read · March 29, 2026

2026
ToolLLM: Facilitating Large Language Models to Master 16000+ Real-world APIs

5 min read · March 29, 2026

2026
Tongyi DeepResearch Technical Report

2 min read · March 29, 2026

2026
Thought Communication in Multiagent Collaboration

2 min read · March 29, 2026

2026
Thinking Augmented Pre-training

3 min read · March 29, 2026

2026
Thinker: Training LLMs in Hierarchical Thinking for Deep Search via Multi-Turn Interaction

1 min read · March 29, 2026

2026
Think Right: Learning to Mitigate Under-Over Thinking via Adaptive, Attentive Compression

8 min read · March 29, 2026

2026
Think Outside the Policy: In-Context Steered Policy Optimization

4 min read · March 29, 2026

2026
TheMCPCompany: Creating General-purpose Agents with Task-specific Tools

2 min read · March 29, 2026

2026
The Universal Landscape of Human Reasoning

3 min read · March 29, 2026

2026
The Rise and Potential of Large Language Model Based Agents: A Survey

3 min read · March 29, 2026

2026