dp66
/

UMA-4B

Text Generation

text-generation-inference

Model card Files Files and versions

dp66 commited on Jan 14

Commit

49f5e00

·

verified ·

1 Parent(s): 0af9f4d

Update README.md

Files changed (1) hide show

README.md +18 -1

README.md CHANGED Viewed

@@ -5,4 +5,21 @@ language:
 base_model:
 - Qwen/Qwen3-4B-Instruct-2507
 library_name: transformers
----

 base_model:
 - Qwen/Qwen3-4B-Instruct-2507
 library_name: transformers
+---
+# UMA-4B
+Agentic RL fine-tuned model
+## Usage
+```python
+from transformers import AutoTokenizer, AutoModelForCausalLM
+tokenizer = AutoTokenizer.from_pretrained("dp66/UMA-4B")
+model = AutoModelForCausalLM.from_pretrained("dp66/UMA-4B")
+```
+## Training Details
+- Base Model: Qwen/Qwen3-4B-Instruct-2507