Tutorials

每日AI最新进展分享。

Judging LLM-as-a-Judge with MT-Bench and Chatbot Arena

4 min read · December 12, 2025

2025
Jailbroken: How Does LLM Safety Training Fail?

3 min read · December 12, 2025

2025
Jailbreaking Black Box Large Language Models in Twenty Queries

7 min read · December 12, 2025

2025
iTransformer: Inverted Transformers Are Effective for Time Series Forecasting

3 min read · December 12, 2025

2025
Is Your Code Generated by ChatGPT Really Correct? Rigorous Evaluation of Large Language Models for Code Generation

3 min read · December 12, 2025

2025