Tutorials

每日AI最新进展分享。

Train for Truth, Keep the Skills: Binary Retrieval-Augmented Reward Mitigates Hallucinations

4 min read · December 12, 2025

2025
Towards Unbiased Calibration using Meta-Regularization

3 min read · December 12, 2025

2025
Towards Flash Thinking via Decoupled Advantage Policy Optimization

4 min read · December 12, 2025

2025
Towards a Unified View of Large Language Model Post-Training

5 min read · December 12, 2025

2025
Towards a Science of Scaling Agent Systems

1 min read · December 12, 2025

2025