jiulaikankan
/

Qwen3-4B-Thinking-Search-R1-baseline

Text Generation

Model card Files Files and versions

These are the training checkpoint results for OpenRLHF-Agent/Search-R1.

Downloads last month: 5

Safetensors

Model size

196k params

Tensor type

BF16

·

Model tree for jiulaikankan/Qwen3-4B-Thinking-Search-R1-baseline

Base model

Qwen/Qwen3-4B-Thinking-2507

Finetuned

(231)

this model