Tutorials

每日AI最新进展分享。

$π_0$: A Vision-Language-Action Flow Model for General Robot Control

3 min read · April 13, 2026

2026
$ΔL$ Normalization: Rethink Loss Aggregation in RLVR

3 min read · April 13, 2026

2026
Youtu-LLM: Unlocking the Native Agentic Potential for Lightweight Large Language Models

2 min read · March 29, 2026

2026
You Need Better Attention Priors

2 min read · March 29, 2026

2026
When Less is More: 8-bit Quantization Improves Continual Learning in Large Language Models

1 min read · March 29, 2026

2026
What Makes Low-Bit Quantization-Aware Training Work for Reasoning LLMs? A Systematic Study

2 min read · March 29, 2026

2026
What Does Loss Optimization Actually Teach, If Anything? Knowledge Dynamics in Continual Pre-training of LLMs

2 min read · March 29, 2026

2026
What Affects the Effective Depth of Large Language Models?

1 min read · March 29, 2026

2026
Web World Models

1 min read · March 29, 2026

2026
Wait, Wait, Wait... Why Do Reasoning Models Loop?

1 min read · March 29, 2026

2026
Visual Language Hypothesis

1 min read · March 29, 2026

2026
Vision Transformers are Circulant Attention Learners

2 min read · March 29, 2026

2026
Understanding and Steering the Cognitive Behaviors of Reasoning Models at Test-Time

1 min read · March 29, 2026

2026
TreeWriter: AI-Assisted Hierarchical Planning and Writing for Long-Form Documents

1 min read · March 29, 2026

2026
Transformers learn factored representations

1 min read · March 29, 2026

2026
Trainable Log-linear Sparse Attention for Efficient Diffusion Transformers

1 min read · March 29, 2026

2026
Towards Execution-Grounded Automated AI Research

1 min read · March 29, 2026

2026
Towards Automated Kernel Generation in the Era of LLMs

1 min read · March 29, 2026

2026
Top 10 Open Challenges Steering the Future of Diffusion Language Model and Its Variants

2 min read · March 29, 2026

2026
The Two-Stage Decision-Sampling Hypothesis: Understanding the Emergence of Self-Reflection in RL-Trained LLMs

1 min read · March 29, 2026

2026
The Reasoning-Creativity Trade-off: Toward Creativity-Driven Problem Solving

1 min read · March 29, 2026

2026
The Illusion of Insight in Reasoning Models

2 min read · March 29, 2026

2026
The Evolution of Reranking Models in Information Retrieval: From Heuristic Methods to Large Language Models

1 min read · March 29, 2026

2026
The Curse and Blessing of Mean Bias in FP4-Quantized LLM Training

2 min read · March 29, 2026

2026
Tackling the Inherent Difficulty of Noise Filtering in RAG

2 min read · March 29, 2026

2026
T5Gemma 2: Seeing, Reading, and Understanding Longer

1 min read · March 29, 2026

2026
Structured Hints for Sample-Efficient Lean Theorem Proving

1 min read · March 29, 2026

2026
Step-GUI Technical Report

2 min read · March 29, 2026

2026
Step-DeepResearch Technical Report

2 min read · March 29, 2026

2026
Statistical Reinforcement Learning in the Real World: A Survey of Challenges and Future Directions

1 min read · March 29, 2026

2026
Stackelberg Learning from Human Feedback: Preference Optimization as a Sequential Game

2 min read · March 29, 2026

2026
SortedRL: Accelerating RL Training for LLMs through Online Length-Aware Scheduling

2 min read · March 29, 2026

2026
SonicMoE: Accelerating MoE with IO and Tile-aware Optimizations

2 min read · March 29, 2026

2026
SkillRouter: Retrieve-and-Rerank Skill Selection for LLM Agents at Scale

2 min read · March 29, 2026

2026
SimpleMem: Efficient Lifelong Memory for LLM Agents

2 min read · March 29, 2026

2026
Sigmoid Head for Quality Estimation under Language Ambiguity

2 min read · March 29, 2026

2026
Semiparametric Preference Optimization: Your Language Model is Secretly a Single-Index Model

2 min read · March 29, 2026

2026
Seedance 1.5 pro: A Native Audio-Visual Joint Generation Foundation Model

1 min read · March 29, 2026

2026
Seed-Prover 1.5: Mastering Undergraduate-Level Theorem Proving via Learning from Experience

1 min read · March 29, 2026

2026
Search over Self-Edit Strategies for LLM Adaptation

1 min read · March 29, 2026

2026
Scaling Reinforcement Learning for Content Moderation with Large Language Models

1 min read · March 29, 2026

2026
RMAAT: Astrocyte-Inspired Memory Compression and Replay for Efficient Long-Context Transformers

2 min read · March 29, 2026

2026
ReX-MLE: The Autonomous Agent Benchmark for Medical Imaging Challenges

2 min read · March 29, 2026

2026
RevFFN: Memory-Efficient Full-Parameter Fine-Tuning of Mixture-of-Experts LLMs with Reversible Blocks

2 min read · March 29, 2026

2026
Retrieval--Reasoning Processes for Multi-hop Question Answering: A Four-Axis Design Framework and Empirical Trends

1 min read · March 29, 2026

2026
Rethinking Supervised Fine-Tuning: Emphasizing Key Answer Tokens for Improved LLM Accuracy

2 min read · March 29, 2026

2026
Recursive Language Models

1 min read · March 29, 2026

2026
Reasoning over mathematical objects: on-policy reward modeling and test time aggregation

2 min read · March 29, 2026

2026
Read As Human: Compressing Context via Parallelizable Close Reading and Skimming

2 min read · March 29, 2026

2026
QwenLong-L1.5: Post-Training Recipe for Long-Context Reasoning and Memory Management

2 min read · March 29, 2026

2026