Tutorials

每日AI最新进展分享。

Batch Prompting Suppresses Overthinking Reasoning Under Constraint: How Batch Prompting Suppresses Overthinking in Reasoning Models

4 min read · December 12, 2025

2025
Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift

2 min read · December 12, 2025

2025
BaseReward: A Strong Baseline for Multimodal Reward Model

5 min read · December 12, 2025

2025
Balanced Actor Initialization: Stable RLHF Training of Distillation-Based Reasoning Models

3 min read · December 12, 2025

2025
BabyBabelLM: A Multilingual Benchmark of Developmentally Plausible Training Data

8 min read · December 12, 2025

2025