Tutorials

每日AI最新进展分享。

RiskPO: Risk-based Policy Optimization via Verifiable Reward for LLM Post-Training

3 min read · December 12, 2025

2025
RewardDance: Reward Scaling in Visual Generation

3 min read · December 12, 2025

2025
Reusing Pre-Training Data at Test Time is a Compute Multiplier

3 min read · December 12, 2025

2025
Retrieval Augmented Generation (RAG) for Fintech: Agentic Design and Evaluation

2 min read · December 12, 2025

2025
Retrieval-Augmented Generation for Large Language Models: A Survey

3 min read · December 12, 2025

2025