Instructions to use openbmb/AgentCPM-Report with libraries, inference providers, notebooks, and local apps. Follow these links to get started.

Libraries

How to use openbmb/AgentCPM-Report with Transformers:

# Use a pipeline as a high-level helper
from transformers import pipeline

pipe = pipeline("text-generation", model="openbmb/AgentCPM-Report", trust_remote_code=True)
messages = [
    {"role": "user", "content": "Who are you?"},
]
pipe(messages)

# Load model directly
from transformers import AutoModel
model = AutoModel.from_pretrained("openbmb/AgentCPM-Report", trust_remote_code=True, dtype="auto")

Notebooks
Google Colab
Kaggle
Local Apps Settings

vLLM

How to use openbmb/AgentCPM-Report with vLLM:

Install from pip and serve model

# Install vLLM from pip:
pip install vllm
# Start the vLLM server:
vllm serve "openbmb/AgentCPM-Report"
# Call the server using curl (OpenAI-compatible API):
curl -X POST "http://localhost:8000/v1/chat/completions" \
	-H "Content-Type: application/json" \
	--data '{
		"model": "openbmb/AgentCPM-Report",
		"messages": [
			{
				"role": "user",
				"content": "What is the capital of France?"
			}
		]
	}'

Use Docker

docker model run hf.co/openbmb/AgentCPM-Report

SGLang

How to use openbmb/AgentCPM-Report with SGLang:

Install from pip and serve model

# Install SGLang from pip:
pip install sglang
# Start the SGLang server:
python3 -m sglang.launch_server \
    --model-path "openbmb/AgentCPM-Report" \
    --host 0.0.0.0 \
    --port 30000
# Call the server using curl (OpenAI-compatible API):
curl -X POST "http://localhost:30000/v1/chat/completions" \
	-H "Content-Type: application/json" \
	--data '{
		"model": "openbmb/AgentCPM-Report",
		"messages": [
			{
				"role": "user",
				"content": "What is the capital of France?"
			}
		]
	}'

Use Docker images

docker run --gpus all \
    --shm-size 32g \
    -p 30000:30000 \
    -v ~/.cache/huggingface:/root/.cache/huggingface \
    --env "HF_TOKEN=<secret>" \
    --ipc=host \
    lmsysorg/sglang:latest \
    python3 -m sglang.launch_server \
        --model-path "openbmb/AgentCPM-Report" \
        --host 0.0.0.0 \
        --port 30000
# Call the server using curl (OpenAI-compatible API):
curl -X POST "http://localhost:30000/v1/chat/completions" \
	-H "Content-Type: application/json" \
	--data '{
		"model": "openbmb/AgentCPM-Report",
		"messages": [
			{
				"role": "user",
				"content": "What is the capital of France?"
			}
		]
	}'

Docker Model Runner
How to use openbmb/AgentCPM-Report with Docker Model Runner:
```
docker model run hf.co/openbmb/AgentCPM-Report
```

Add library_name and pipeline_tag metadata

by nielsr HF Staff - opened Feb 11

base: refs/heads/main

←

from: refs/pr/1

Discussion Files changed

-262

Files changed (1) hide show

README.md +9 -262

README.md CHANGED Viewed

@@ -1,9 +1,12 @@
 ---
 license: apache-2.0
 tags:
-- text-generation-inference
 - agent
 ---
 # AgentCPM-Report: Gemini-2.5-pro-DeepResearch Level Local DeepResearch
 <p align="center">
@@ -14,6 +17,10 @@ tags:
 <a href='https://arxiv.org/abs/2602.06540'><img src='https://img.shields.io/badge/arXiv-2602.06540-red'>
 </p>
 ## Links & Resources
 ### 📊 AgentCPM-Report Models
 - **[AgentCPM-Report](https://huggingface.co/openbmb/AgentCPM-Report)** The Gemini-2.5-pro-DeepResearch Level Local DeepResearch Model
@@ -74,271 +81,11 @@ You can read more tutorials about AgentCPM-Report in the [documentation](https:/
 ## Evaluation
-<table align="center">
-  <thead>
-    <tr>
-      <th align="center">DeepResearch Bench</th>
-      <th align="center">Overall</th>
-      <th align="center">Comprehensiveness</th>
-      <th align="center">Insight</th>
-      <th align="center">Instruction Following</th>
-      <th align="center">Readability</th>
-    </tr>
-  </thead>
-  <tbody>
-    <tr>
-      <td align="center">Doubao-research</td>
-      <td align="center">44.34</td>
-      <td align="center">44.84</td>
-      <td align="center">40.56</td>
-      <td align="center">47.95</td>
-      <td align="center">44.69</td>
-    </tr>
-    <tr>
-      <td align="center">Claude-research</td>
-      <td align="center">45.00</td>
-      <td align="center">45.34</td>
-      <td align="center">42.79</td>
-      <td align="center">47.58</td>
-      <td align="center">44.66</td>
-    </tr>
-    <tr>
-      <td align="center">OpenAI-deepresearch</td>
-      <td align="center">46.45</td>
-      <td align="center">46.46</td>
-      <td align="center">43.73</td>
-      <td align="center">49.39</td>
-      <td align="center">47.22</td>
-    </tr>
-    <tr>
-      <td align="center">Gemini-2.5-Pro-deepresearch</td>
-      <td align="center">49.71</td>
-      <td align="center">49.51</td>
-      <td align="center">49.45</td>
-      <td align="center">50.12</td>
-      <td align="center">50.00</td>
-    </tr>
-    <tr>
-      <td align="center">WebWeaver(Qwen3-30B-A3B)</td>
-      <td align="center">46.77</td>
-      <td align="center">45.15</td>
-      <td align="center">45.78</td>
-      <td align="center">49.21</td>
-      <td align="center">47.34</td>
-    </tr>
-    <tr>
-      <td align="center">WebWeaver(Claude-Sonnet-4)</td>
-      <td align="center">50.58</td>
-      <td align="center">51.45</td>
-      <td align="center">50.02</td>
-      <td align="center">50.81</td>
-      <td align="center">49.79</td>
-    </tr>
-    <tr>
-      <td align="center">Enterprise-DR(Gemini-2.5-Pro)</td>
-      <td align="center">49.86</td>
-      <td align="center">49.01</td>
-      <td align="center">50.28</td>
-      <td align="center">50.03</td>
-      <td align="center">49.98</td>
-    </tr>
-    <tr>
-      <td align="center">RhinoInsigh(Gemini-2.5-Pro)</td>
-      <td align="center">50.92</td>
-      <td align="center">50.51</td>
-      <td align="center">51.45</td>
-      <td align="center">51.72</td>
-      <td align="center">50.00</td>
-    </tr>
-    <tr>
-      <td align="center">AgentCPM-Report</td>
-      <td align="center">50.11</td>
-      <td align="center">50.54</td>
-      <td align="center">52.64</td>
-      <td align="center">48.87</td>
-      <td align="center">44.17</td>
-    </tr>
-  </tbody>
-</table>
-<table align="center">
-  <thead>
-    <tr>
-      <th align="center">DeepResearch Gym</th>
-      <th align="center">Avg.</th>
-      <th align="center">Clarity</th>
-      <th align="center">Depth</th>
-      <th align="center">Balance</th>
-      <th align="center">Breadth</th>
-      <th align="center">Support</th>
-      <th align="center">Insightfulness</th>
-    </tr>
-  </thead>
-  <tbody>
-    <tr>
-      <td align="center">Doubao-research</td>
-      <td align="center">84.46</td>
-      <td align="center">68.85</td>
-      <td align="center">93.12</td>
-      <td align="center">83.96</td>
-      <td align="center">93.33</td>
-      <td align="center">84.38</td>
-      <td align="center">83.12</td>
-    </tr>
-    <tr>
-      <td align="center">Claude-research</td>
-      <td align="center">80.25</td>
-      <td align="center">86.67</td>
-      <td align="center">96.88</td>
-      <td align="center">84.41</td>
-      <td align="center">96.56</td>
-      <td align="center">26.77</td>
-      <td align="center">90.22</td>
-    </tr>
-    <tr>
-      <td align="center">OpenAI-deepresearch</td>
-      <td align="center">91.27</td>
-      <td align="center">84.90</td>
-      <td align="center">98.10</td>
-      <td align="center">89.80</td>
-      <td align="center">97.40</td>
-      <td align="center">88.40</td>
-      <td align="center">89.00</td>
-    </tr>
-    <tr>
-      <td align="center">Gemini-2.5-pro-deepresearch</td>
-      <td align="center">96.02</td>
-      <td align="center">90.71</td>
-      <td align="center">99.90</td>
-      <td align="center">93.37</td>
-      <td align="center">99.69</td>
-      <td align="center">95.00</td>
-      <td align="center">97.45</td>
-    </tr>
-    <tr>
-      <td align="center">WebWeaver (Qwen3-30b-a3b)</td>
-      <td align="center">77.27</td>
-      <td align="center">71.88</td>
-      <td align="center">85.51</td>
-      <td align="center">75.80</td>
-      <td align="center">84.78</td>
-      <td align="center">63.77</td>
-      <td align="center">81.88</td>
-    </tr>
-    <tr>
-      <td align="center">WebWeaver (Claude-sonnet-4)</td>
-      <td align="center">96.77</td>
-      <td align="center">90.50</td>
-      <td align="center">99.87</td>
-      <td align="center">94.30</td>
-      <td align="center">100.00</td>
-      <td align="center">98.73</td>
-      <td align="center">97.22</td>
-    </tr>
-    <tr>
-      <td align="center">AgentCPM-Report</td>
-      <td align="center">98.48</td>
-      <td align="center">95.10</td>
-      <td align="center">100.00</td>
-      <td align="center">98.50</td>
-      <td align="center">100.00</td>
-      <td align="center">97.30</td>
-      <td align="center">100.00</td>
-    </tr>
-  </tbody>
-</table>
-<table align="center">
-  <thead>
-    <tr>
-      <th align="center">DeepConsult</th>
-      <th align="center">Avg.</th>
-      <th align="center">Win</th>
-      <th align="center">Tie</th>
-      <th align="center">Lose</th>
-    </tr>
-  </thead>
-  <tbody>
-    <tr>
-      <td align="center">Doubao-research</td>
-      <td align="center">5.42</td>
-      <td align="center">29.95</td>
-      <td align="center">40.35</td>
-      <td align="center">29.70</td>
-    </tr>
-    <tr>
-      <td align="center">Claude-research</td>
-      <td align="center">4.60</td>
-      <td align="center">25.00</td>
-      <td align="center">38.89</td>
-      <td align="center">36.11</td>
-    </tr>
-    <tr>
-      <td align="center">OpenAI-deepresearch</td>
-      <td align="center">5.00</td>
-      <td align="center">0.00</td>
-      <td align="center">100.00</td>
-      <td align="center">0.00</td>
-    </tr>
-    <tr>
-      <td align="center">Gemini-2.5-Pro-deepresearch</td>
-      <td align="center">6.70</td>
-      <td align="center">61.27</td>
-      <td align="center">31.13</td>
-      <td align="center">7.60</td>
-    </tr>
-    <tr>
-      <td align="center">WebWeaver(Qwen3-30B-A3B)</td>
-      <td align="center">4.57</td>
-      <td align="center">28.65</td>
-      <td align="center">34.90</td>
-      <td align="center">36.46</td>
-    </tr>
-    <tr>
-      <td align="center">WebWeaver(Claude-Sonnet-4)</td>
-      <td align="center">6.96</td>
-      <td align="center">66.86</td>
-      <td align="center">10.47</td>
-      <td align="center">22.67</td>
-    </tr>
-    <tr>
-      <td align="center">Enterprise-DR(Gemini-2.5-Pro)</td>
-      <td align="center">6.82</td>
-      <td align="center">71.57</td>
-      <td align="center">19.12</td>
-      <td align="center">9.31</td>
-    </tr>
-    <tr>
-      <td align="center">RhinoInsigh(Gemini-2.5-Pro)</td>
-      <td align="center">6.82</td>
-      <td align="center">68.51</td>
-      <td align="center">11.02</td>
-      <td align="center">20.47</td>
-    </tr>
-    <tr>
-      <td align="center">AgentCPM-Report</td>
-      <td align="center">6.60</td>
-      <td align="center">57.60</td>
-      <td align="center">13.73</td>
-      <td align="center">28.68</td>
-    </tr>
-  </tbody>
-</table>
-Our evaluation datasets include DeepResearch Bench, DeepConsult, and DeepResearch Gym. The writing-time knowledge base includes about 2.7 million [Arxiv papers](https://www.kaggle.com/api/v1/datasets/download/Cornell-University/arxiv) and about 200,000 internal webpage summaries.
 ## Acknowledgements
 This project would not be possible without the support and contributions of the open-source community. During development, we referred to and used multiple excellent open-source frameworks, models, and data resources, including [verl](https://github.com/volcengine/verl), [UltraRAG](https://github.com/OpenBMB/UltraRAG), [MiniCPM4.1](https://github.com/OpenBMB/MiniCPM), and [SurveyGo](https://surveygo.modelbest.cn/).
-## Contributions
-Project leads: Yishan Li, Wentong Chen
-Contributors: Yishan Li, Wentong Chen, Yukun Yan, Mingwei Li, Sen Mei, Xiaorong Wang, Kunpeng Liu, Xin Cong, Shuo Wang, Zhong Zhang, Yaxi Lu, Zhenghao Liu, Yankai Lin, Zhiyuan Liu, Maosong Sun
-Advisors: Yukun Yan, Yankai Lin, Zhiyuan Liu, Maosong Sun
 ## Citation
 If **AgentCPM-Report** is helpful for your research, please cite it as follows:

 ---
 license: apache-2.0
+library_name: transformers
+pipeline_tag: text-generation
 tags:
 - agent
+- text-generation-inference
 ---
 # AgentCPM-Report: Gemini-2.5-pro-DeepResearch Level Local DeepResearch
 <p align="center">
 <a href='https://arxiv.org/abs/2602.06540'><img src='https://img.shields.io/badge/arXiv-2602.06540-red'>
 </p>
+This repository contains **AgentCPM-Report**, an 8B-parameter deep research agent introduced in the paper [AgentCPM-Report: Interleaving Drafting and Deepening for Open-Ended Deep Research](https://arxiv.org/abs/2602.06540).
+AgentCPM-Report uses a **Writing As Reasoning Policy (WARP)** to dynamically revise outlines during report generation, alternating between evidence-based drafting and reasoning-driven deepening to produce high-quality, long-form research reports.
 ## Links & Resources
 ### 📊 AgentCPM-Report Models
 - **[AgentCPM-Report](https://huggingface.co/openbmb/AgentCPM-Report)** The Gemini-2.5-pro-DeepResearch Level Local DeepResearch Model
 ## Evaluation
+Experiments on DeepResearch Bench, DeepConsult, and DeepResearch Gym demonstrate that AgentCPM-Report outperforms leading closed-source systems, with substantial gains in Insight. Detailed benchmark results can be found in the associated research paper.
 ## Acknowledgements
 This project would not be possible without the support and contributions of the open-source community. During development, we referred to and used multiple excellent open-source frameworks, models, and data resources, including [verl](https://github.com/volcengine/verl), [UltraRAG](https://github.com/OpenBMB/UltraRAG), [MiniCPM4.1](https://github.com/OpenBMB/MiniCPM), and [SurveyGo](https://surveygo.modelbest.cn/).
 ## Citation
 If **AgentCPM-Report** is helpful for your research, please cite it as follows: