Tutorials

每日AI最新进展分享。

ParallelMuse: Agentic Parallel Thinking for Deep Information Seeking

2 min read · March 29, 2026

2026
Paper2Agent: Reimagining Research Papers As Interactive and Reliable AI Agents

2 min read · March 29, 2026

2026
PaLM-E: An Embodied Multimodal Language Model

4 min read · March 29, 2026

2026
Outcome-based Exploration for LLM Reasoning

3 min read · March 29, 2026

2026
ORION: Teaching Language Models to Reason Efficiently in the Language of Thought

2 min read · March 29, 2026

2026
Optimizing Mixture of Block Attention

1 min read · March 29, 2026

2026
OpenVLA: An Open-Source Vision-Language-Action Model

3 min read · March 29, 2026

2026
OpenAssistant Conversations -- Democratizing Large Language Model Alignment

2 min read · March 29, 2026

2026
Open Data Synthesis For Deep Research

5 min read · March 29, 2026

2026
Opal: An Operator Algebra View of RLHF

3 min read · March 29, 2026

2026
Online Process Reward Leanring for Agentic Reinforcement Learning

5 min read · March 29, 2026

2026
OnePiece: Bringing Context Engineering and Reasoning to Industrial Cascade Ranking System

5 min read · March 29, 2026

2026
On the Theoretical Limitations of Embedding-Based Retrieval

2 min read · March 29, 2026

2026
On the Origin of Algorithmic Progress in AI

1 min read · March 29, 2026

2026
On the Interplay of Pre-Training, Mid-Training, and RL on Reasoning Language Models

1 min read · March 29, 2026

2026
On the Fundamental Limits of LLMs at Scale

1 min read · March 29, 2026

2026
On-line Policy Improvement using Monte-Carlo Search

2 min read · March 29, 2026

2026
On GRPO Collapse in Search-R1: The Lazy Likelihood-Displacement Death Spiral

1 min read · March 29, 2026

2026
OmniScientist: Toward a Co-evolving Ecosystem of Human and AI Scientists

1 min read · March 29, 2026

2026
Octo: An Open-Source Generalist Robot Policy

4 min read · March 29, 2026

2026
Object Recognition Datasets and Challenges: A Review

6 min read · March 29, 2026

2026
Not All Parameters Are Created Equal: Smart Isolation Boosts Fine-Tuning Performance

3 min read · March 29, 2026

2026
Natural Language Actor-Critic: Scalable Off-Policy Learning in Language Space

2 min read · March 29, 2026

2026
Multimodal Deep Learning

3 min read · March 29, 2026

2026
Multi-Phase Spacecraft Trajectory Optimization via Transformer-Based Reinforcement Learning

1 min read · March 29, 2026

2026
Multi-Agent Evolve: LLM Self-Improve through Co-evolution

4 min read · March 29, 2026

2026
MoM: Mixtures of Scenario-Aware Document Memories for Retrieval-Augmented Generation Systems

2 min read · March 29, 2026

2026
Model Compression using Progressive Channel Pruning

1 min read · March 29, 2026

2026
MobileLLM-Pro Technical Report

1 min read · March 29, 2026

2026
MM-Vet: Evaluating Large Multimodal Models for Integrated Capabilities

8 min read · March 29, 2026

2026
Mixture-of-Minds: Multi-Agent Reinforcement Learning for Table Understanding

5 min read · March 29, 2026

2026
Mixture of Contexts for Long Video Generation

3 min read · March 29, 2026

2026
Mixtral of Experts

4 min read · March 29, 2026

2026
Mitigating Hallucination in Large Language Models (LLMs): An Application-Oriented Survey on RAG, Reasoning, and Agentic Systems

2 min read · March 29, 2026

2026
Mistral 7B

3 min read · March 29, 2026

2026
MiroThinker: Pushing the Performance Boundaries of Open-Source Research Agents via Model, Context, and Interactive Scaling

1 min read · March 29, 2026

2026
Midtraining Bridges Pretraining and Posttraining Distributions

2 min read · March 29, 2026

2026
Mid-Training of Large Language Models: A Survey

2 min read · March 29, 2026

2026
MeSH: Memory-as-State-Highways for Recursive Transformers

3 min read · March 29, 2026

2026
Memory Retrieval and Consolidation in Large Language Models through Function Tokens

3 min read · March 29, 2026

2026
Memory-R1: Enhancing Large Language Model Agents to Manage and Utilize Memories via Reinforcement Learning

4 min read · March 29, 2026

2026
MCP vs RAG vs NLWeb vs HTML: A Comparison of the Effectiveness and Efficiency of Different Agent Interfaces to the Web (Technical Report)

1 min read · March 29, 2026

2026
MaxShapley: Towards Incentive-compatible Generative Search with Fair Context Attribution

1 min read · March 29, 2026

2026
Matrix: Peer-to-Peer Multi-Agent Synthetic Data Generation Framework

1 min read · March 29, 2026

2026
MathVista: Evaluating Mathematical Reasoning of Foundation Models in Visual Contexts

6 min read · March 29, 2026

2026
Mathematical Framing for Different Agent Strategies

2 min read · March 29, 2026

2026
MARS: Optimizing Dual-System Deep Research via Multi-Agent Reinforcement Learning

5 min read · March 29, 2026

2026
MAPEX: A Multi-Agent Pipeline for Keyphrase Extraction

3 min read · March 29, 2026

2026
Mamba: Linear-Time Sequence Modeling with Selective State Spaces

3 min read · March 29, 2026

2026
LORE: A Large Generative Model for Search Relevance

1 min read · March 29, 2026

2026