Tutorials

每日AI最新进展分享。

Autonomous Agents for Scientific Discovery: Orchestrating Scientists, Language, Code, and Physics

2 min read · December 12, 2025

2025
Auto-Rubric: Learning to Extract Generalizable Criteria for Reward Modeling

4 min read · December 12, 2025

2025
Attention Illuminates LLM Reasoning: The Preplan-and-Anchor Rhythm Enables Fine-Grained Policy Optimization

1 min read · December 12, 2025

2025
Asymmetric Proximal Policy Optimization: mini-critics boost LLM reasoning

3 min read · December 12, 2025

2025
Artificial Hippocampus Networks for Efficient Long-Context Modeling

3 min read · December 12, 2025

2025