Tutorials

每日AI最新进展分享。

Less is More Tokens: Efficient Math Reasoning via Difficulty-Aware Chain-of-Thought Distillation

5 min read · December 12, 2025

2025
Learning When to Plan: Efficiently Allocating Test-Time Compute for LLM Agents

2 min read · December 12, 2025

2025
Learning to Reason: Training LLMs with GPT-OSS or DeepSeek R1 Reasoning Traces

1 min read · December 12, 2025

2025
Learning to Focus: Focal Attention for Selective and Scalable Transformers

1 min read · December 12, 2025

2025
Learning on the Job: An Experience-Driven Self-Evolving Agent for Long-Horizon Tasks

2 min read · December 12, 2025

2025