Tutorials

每日AI最新进展分享。

Expand Neurons, Not Parameters

2 min read · March 29, 2026

2026
Executable Counterfactuals: Improving LLMs' Causal Reasoning Through Code

2 min read · March 29, 2026

2026
Every Token Counts: Generalizing 16M Ultra-Long Context in Large Language Models

1 min read · March 29, 2026

2026
Every Question Has Its Own Value: Reinforcement Learning with Explicit Human Values

4 min read · March 29, 2026

2026
Every Attention Matters: An Efficient Hybrid Architecture for Long-Context Reasoning

3 min read · March 29, 2026

2026
Enhancing Large Language Model Reasoning with Reward Models: An Analytical Survey

4 min read · March 29, 2026

2026
Encoder-Decoder or Decoder-Only? Revisiting Encoder-Decoder Large Language Model

4 min read · March 29, 2026

2026
Empowering Real-World: A Survey on the Technology, Practice, and Evaluation of LLM-driven Industry Agents

2 min read · March 29, 2026

2026
EmoRAG: Evaluating RAG Robustness to Symbolic Perturbations

1 min read · March 29, 2026

2026
ELPO: Ensemble Learning Based Prompt Optimization for Large Language Models

1 min read · March 29, 2026

2026
Efficient Streaming Language Models with Attention Sinks

3 min read · March 29, 2026

2026
Efficient Reinforcement Learning for Large Language Models with Intrinsic Exploration

5 min read · March 29, 2026

2026
Efficient Memory Management for Large Language Model Serving with PagedAttention

3 min read · March 29, 2026

2026
Effective context engineering for AI agents

2 min read · March 29, 2026

2026
Educational data mining and learning analytics: An updated survey

9 min read · March 29, 2026

2026
Dynamic Speculative Agent Planning

4 min read · March 29, 2026

2026
Dynamic Affective Memory Management for Personalized LLM Agents

3 min read · March 29, 2026

2026
Dual-Weighted Reinforcement Learning for Generative Preference Modeling

3 min read · March 29, 2026

2026
Dual LoRA: Enhancing LoRA with Magnitude and Direction Updates

1 min read · March 29, 2026

2026
DRO-InstructZero: Distributionally Robust Prompt Optimization for Large Language Models

2 min read · March 29, 2026

2026
DR. WELL: Dynamic Reasoning and Learning with Symbolic World Model for Embodied LLM-Based Multi-Agent Collaboration

2 min read · March 29, 2026

2026
DR Tulu: Reinforcement Learning with Evolving Rubrics for Deep Research

1 min read · March 29, 2026

2026
DoPE: Denoising Rotary Position Embedding

1 min read · March 29, 2026

2026
Does Reinforcement Learning Really Incentivize Reasoning Capacity in LLMs Beyond the Base Model?

3 min read · March 29, 2026

2026
DocReward: A Document Reward Model for Structuring and Stylizing

5 min read · March 29, 2026

2026
Do Not Step Into the Same River Twice: Learning to Reason from Trial and Error

6 min read · March 29, 2026

2026
Do Depth-Grown Models Overcome the Curse of Depth? An In-Depth Analysis

1 min read · March 29, 2026

2026
DLER: Doing Length pEnalty Right - Incentivizing More Intelligence per Token via Reinforcement Learning

3 min read · March 29, 2026

2026
Direct Preference Optimization: Your Language Model is Secretly a Reward Model

2 min read · March 29, 2026

2026
Diffusion Language Models are Super Data Learners

3 min read · March 29, 2026

2026
Detecting Data Contamination in LLMs via In-Context Learning

3 min read · March 29, 2026

2026
Demystifying Synthetic Data in LLM Pre-training: A Systematic Study of Scaling Laws, Benefits, and Pitfalls

2 min read · March 29, 2026

2026
DELTA: Decoupling Long-Tailed Online Continual Learning

4 min read · March 29, 2026

2026
Defeating the Training-Inference Mismatch via FP16

2 min read · March 29, 2026

2026
DeepWideSearch: Benchmarking Depth and Width in Agentic Information Seeking

3 min read · March 29, 2026

2026
DeepSeekMath-V2: Towards Self-Verifiable Mathematical Reasoning

2 min read · March 29, 2026

2026
DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models

5 min read · March 29, 2026

2026
DeepSeek-V3.2: Pushing the Frontier of Open Large Language Models

1 min read · March 29, 2026

2026
DeepSeek-V3 Technical Report

3 min read · March 29, 2026

2026
DeepSeek-V2: A Strong, Economical, and Efficient Mixture-of-Experts Language Model

4 min read · March 29, 2026

2026
DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

3 min read · March 29, 2026

2026
DeepDive: Advancing Deep Search Agents with Knowledge Graphs and Multi-Turn RL

6 min read · March 29, 2026

2026
DeepAgent: A General Reasoning Agent with Scalable Toolsets

6 min read · March 29, 2026

2026
Deep sequence models tend to memorize geometrically; it is unclear why

2 min read · March 29, 2026

2026
Deep Self-Evolving Reasoning

2 min read · March 29, 2026

2026
Dataset Growth

4 min read · March 29, 2026

2026
DataSage: Multi-agent Collaboration for Insight Discovery with External Knowledge Retrieval, Multi-role Debating, and Multi-path Reasoning

2 min read · March 29, 2026

2026
Data-Efficient RLVR via Off-Policy Influence Guidance

2 min read · March 29, 2026

2026
DAPO: An Open-Source LLM Reinforcement Learning System at Scale

3 min read · March 29, 2026

2026
DAComp: Benchmarking Data Agents across the Full Data Intelligence Lifecycle

1 min read · March 29, 2026

2026