Tutorials

每日AI最新进展分享。

Inpainting-Guided Policy Optimization for Diffusion Large Language Models

5 min read · March 29, 2026

2026
Inefficiencies of Meta Agents for Agent Design

2 min read · March 29, 2026

2026
Incorporating Self-Rewriting into Large Language Model Reasoning Reinforcement

1 min read · March 29, 2026

2026
In-Context Distillation with Self-Consistency Cascades: A Simple, Training-Free Way to Reduce LLM Agent Costs

1 min read · March 29, 2026

2026
Improving Online Algorithms via ML Predictions

2 min read · March 29, 2026

2026
Improving Context Fidelity via Native Retrieval-Augmented Reasoning

3 min read · March 29, 2026

2026
Improved Baselines with Visual Instruction Tuning

3 min read · March 29, 2026

2026
Imbalanced Gradients in RL Post-Training of Multi-Task LLMs

2 min read · March 29, 2026

2026
ImageBind: One Embedding Space To Bind Them All

3 min read · March 29, 2026

2026
Hybrid Architectures for Language Models: Systematic Analysis and Design Insights

3 min read · March 29, 2026

2026
HunyuanVideo 1.5 Technical Report

1 min read · March 29, 2026

2026
HPLT 3.0: Very Large-Scale Multilingual Resources for LLM and MT. Mono- and Bi-lingual Data, Multilingual Evaluation, and Pre-Trained Models

7 min read · March 29, 2026

2026
How Far Are We from Genuinely Useful Deep Research Agents?

3 min read · March 29, 2026

2026
How Does RL Post-training Induce Skill Composition? A Case Study on Countdown

1 min read · March 29, 2026

2026
Higher-order Linear Attention

2 min read · March 29, 2026

2026
Higher Embedding Dimension Creates a Stronger World Model for a Simple Sorting Task

2 min read · March 29, 2026

2026
HEAL: A Hypothesis-Based Preference-Aware Analysis Framework

2 min read · March 29, 2026

2026
Harnessing Uncertainty: Entropy-Modulated Policy Gradients for Long-Horizon LLM Agents

3 min read · March 29, 2026

2026
Harnessing the Power of LLMs in Practice: A Survey on ChatGPT and Beyond

3 min read · March 29, 2026

2026
HarmBench: A Standardized Evaluation Framework for Automated Red Teaming and Robust Refusal

4 min read · March 29, 2026

2026
HaluMem: Evaluating Hallucinations in Memory Systems of Agents

1 min read · March 29, 2026

2026
HAD: HAllucination Detection Language Models Based on a Comprehensive Hallucination Taxonomy

4 min read · March 29, 2026

2026
GUI-360: A Comprehensive Dataset and Benchmark for Computer-Using Agents

4 min read · March 29, 2026

2026
Group Representational Position Encoding

3 min read · March 29, 2026

2026
Graph of Thoughts: Solving Elaborate Problems with Large Language Models

3 min read · March 29, 2026

2026
GPT-4o System Card

4 min read · March 29, 2026

2026
GPT-4 Technical Report

3 min read · March 29, 2026

2026
GPQA: A Graduate-Level Google-Proof Q&A Benchmark

2 min read · March 29, 2026

2026
Generative Models for Synthetic Data: Transforming Data Mining in the GenAI Era

2 min read · March 29, 2026

2026
Generative Early Stage Ranking

1 min read · March 29, 2026

2026
Generative Data Refinement: Just Ask for Better Data

2 min read · March 29, 2026

2026
Generative AI

4 min read · March 29, 2026

2026
General Agentic Memory Via Deep Research

1 min read · March 29, 2026

2026
Gemma 2: Improving Open Language Models at a Practical Size

3 min read · March 29, 2026

2026
GEM: A Gym for Agentic LLMs

4 min read · March 29, 2026

2026
GatePro: Parameter-Free Expert Selection Optimization for Mixture-of-Experts Models

2 min read · March 29, 2026

2026
GaLLoP: Gradient-based Sparse Learning on Low-Magnitude Parameters

2 min read · March 29, 2026

2026
From Experience to Strategy: Empowering LLM Agents with Trainable Graph Memory

1 min read · March 29, 2026

2026
Fourier Neural Operators Explained: A Practical Perspective

1 min read · March 29, 2026

2026
ForTIFAI: Fending Off Recursive Training Induced Failure for AI Models

3 min read · March 29, 2026

2026
FlowRL: Matching Reward Distributions for LLM Reasoning

4 min read · March 29, 2026

2026
FLEX: Continuous Agent Evolution via Forward Learning from Experience

2 min read · March 29, 2026

2026
First Try Matters: Revisiting the Role of Reflection in Reasoning Models

3 min read · March 29, 2026

2026
Fast attention mechanisms: a tale of parallelism

3 min read · March 29, 2026

2026
FAPO: Flawed-Aware Policy Optimization for Efficient and Reliable Reasoning

2 min read · March 29, 2026

2026
Failure Makes the Agent Stronger: Enhancing Accuracy through Structured Reflection for Reliable Tool Interactions

2 min read · March 29, 2026

2026
FActScore: Fine-grained Atomic Evaluation of Factual Precision in Long Form Text Generation

3 min read · March 29, 2026

2026
F -- A Model of Events based on the Foundational Ontology DOLCE+DnS Ultralite

3 min read · March 29, 2026

2026
Extracting alignment data in open models

2 min read · March 29, 2026

2026
Explaining the Success of Nearest Neighbor Methods in Prediction

3 min read · March 29, 2026

2026