DeepBrainz
/

DeepBrainz-R1-2B-16K

Text Generation

text-generation-inference

Model card Files Files and versions

ArunkumarVR commited on Jan 30

Commit

87a5359

·

verified ·

1 Parent(s): 6efdd81

Update README.md

Files changed (1) hide show

README.md +2 -2

README.md CHANGED Viewed

@@ -28,7 +28,7 @@ cost-efficient to deploy.
 - **16K context length**
 - Optimized for reasoning-centric tasks
 - Designed for modern GPU inference runtimes
-- **Architecture:** Qwen3-compatible (DeepBrainz-R series fine-tuned and optimized for reasoning-centric workloads)
 ---
@@ -72,7 +72,7 @@ print(tok.decode(out[0], skip_special_tokens=True))
 ## Training Summary
 The model was produced using a multi-stage optimization process involving
-large-scale supervision and iterative refinement to improve reasoning
 quality and robustness. Specific training details are intentionally
 abstracted in this public release.

 - **16K context length**
 - Optimized for reasoning-centric tasks
 - Designed for modern GPU inference runtimes
+- **Architecture:** Qwen3-compatible (DeepBrainz-R series post-trained and optimized for reasoning-centric workloads)
 ---
 ## Training Summary
 The model was produced using a multi-stage optimization process involving
+large-scale on-policy optimization and iterative refinement to improve reasoning
 quality and robustness. Specific training details are intentionally
 abstracted in this public release.