xsanskarx
/

thinkygemma-4b

Text Generation

image-text-to-text

text-generation-inference

Model card Files Files and versions

xsanskarx commited on Oct 14, 2025

Commit

b966441

·

verified ·

1 Parent(s): 4f373d5

Update README.md

Files changed (1) hide show

README.md +3 -3

README.md CHANGED Viewed

@@ -4,7 +4,7 @@ base_model:
 pipeline_tag: text-generation
 library_name: transformers
 ---
-# **thinkygemma-4b: your average fake reasoner**
 Fine-tuned from **Gemma-3-4b-pt**
 📌 **Model ID:** `xsanskarx/thinkygemma-4b`
@@ -17,11 +17,11 @@ Fine-tuned from **Gemma-3-4b-pt**
 ---
 ## **Model Description**
-This is a **fine-tuned version of Google's Gemma-3-4b-it**, adapted for **structured reasoning / fake induced reasoning **. It is designed to excel in acting like a great reasoner**.
 ### **Training Details**
 - **Hardware:** Single NVIDIA **H100**
-- **Training Time:** **9 hours (1 epoch)**
 - **Training Method:** **LoRA fine-tuning (r = 128, alpha = 256)**
 - **Dataset:** **25k CoT traces**
 - **Base Model:** `google/gemma-3-4b-it`

 pipeline_tag: text-generation
 library_name: transformers
 ---
+# **thinkygemma-4b: your average reasoner**
 Fine-tuned from **Gemma-3-4b-pt**
 📌 **Model ID:** `xsanskarx/thinkygemma-4b`
 ---
 ## **Model Description**
+This is a **fine-tuned version of Google's Gemma-3-4b-it**, adapted for **structured reasoning / induced reasoning behaviour.
 ### **Training Details**
 - **Hardware:** Single NVIDIA **H100**
+- **Training Time:** **9 hours**
 - **Training Method:** **LoRA fine-tuning (r = 128, alpha = 256)**
 - **Dataset:** **25k CoT traces**
 - **Base Model:** `google/gemma-3-4b-it`