RthItalia
/

Rth-lm-code-25b

Text Generation

non-transformer

Model card Files Files and versions

RthItalia commited on Feb 19

Commit

affd687

·

verified ·

1 Parent(s): a2a2f24

Update README.md

Files changed (1) hide show

README.md +9 -9

README.md CHANGED Viewed

@@ -20,8 +20,8 @@ pipeline_tag: text-generation
 # 💻 RTH-Code 25B — Code Specialist Soul
 > **"L'intelligenza è nell'architettura, non nelle GPU."**
-> Questa è la **Soul Specialista per il Codice** dell'ecosistema RTH-LM.
-> Stesso Genome (7B) di base, ma con una "anima" addestrata per programmare.
 ⚠️ **PROOF OF CONCEPT** ⚠️
 Questa è una versione **BASE** creata per dimostrare l'efficienza scalare dell'architettura RTH-LM.
@@ -34,7 +34,7 @@ Questa è una versione **BASE** creata per dimostrare l'efficienza scalare dell'
 ## ⚡ Che cos'è?
 **RTH-Code 25B** non è un modello a sé stante. È una **Soul intercambiabile**.
-Invece di scaricare un modello da 30GB per ogni task, mantieni il **Genome congelato (7B)** e cambi solo la Soul (~950M parametri).
 Questa Soul è stata addestrata specificamente su:
 - **Python** (Data Science, Backend, Torch)
@@ -45,8 +45,8 @@ Questa Soul è stata addestrata specificamente su:
 ```mermaid
 graph TD
     G["Genome 7B<br/>(Frozen Core)"]
-    G --> SC["🔹 Soul CODE<br/>Specialista Python/JS/C++"]
-    G --> SG["Soul Generalista<br/>Chat & Knowledge"]
     G --> SL["Soul Legal/Medical<br/>(Future)"]
 ```
@@ -56,11 +56,11 @@ Basta **swappare** i file `.pt` (o usare il GGUF unificato) e il tuo modello pas
 ## 📊 Specifiche Tecniche
-| Feature | Dettaglio |
 |---|---|
-| **Architettura** | Fractal Gated Causal TCN (No Attention) |
-| **Parametri Totali** | 25B (7B Genome + 18B Virtuali) |
-| **Parametri Trainabili** | ~950M (LoRA Rank 512) |
 | **Dataset Training** | **5GB** (Misto: Python, JS, C++, Go) |
 | **Tempo Training** | **8 ORE** (Singola Epoch) ⏱️ |
 | **Contesto** | 2048+ (Teoricamente infinito grazie a TCN) |

 # 💻 RTH-Code 25B — Code Specialist Soul
 > **"L'intelligenza è nell'architettura, non nelle GPU."**
+> Questa è la **Soul Specialista per il Codice** dell'ecosistema RTH-LM (V4 Architecture).
+> Stesso Genome (7B) di base, ma con una "anima" addestrata per programmare (basata su V4 Expanded).
 ⚠️ **PROOF OF CONCEPT** ⚠️
 Questa è una versione **BASE** creata per dimostrare l'efficienza scalare dell'architettura RTH-LM.
 ## ⚡ Che cos'è?
 **RTH-Code 25B** non è un modello a sé stante. È una **Soul intercambiabile**.
+Invece di scaricare un modello da 30GB per ogni task, mantieni il **Genome congelato (7B)** e cambi solo la Soul (**~3.8GB**).
 Questa Soul è stata addestrata specificamente su:
 - **Python** (Data Science, Backend, Torch)
 ```mermaid
 graph TD
     G["Genome 7B<br/>(Frozen Core)"]
+    G --> SC["🔹 Soul CODE<br/>Specialista V4 (25B)"]
+    G --> SG["Soul Generalista<br/>Chat & Knowledge V4"]
     G --> SL["Soul Legal/Medical<br/>(Future)"]
 ```
 ## 📊 Specifiche Tecniche
+| **Feature** | **Dettaglio** |
 |---|---|
+| **Architettura** | Fractal Gated Causal TCN (No Attention) - **V4 Enhanced** |
+| **Parametri Totali** | **25B** (Genome + Soul V4 Expanded) |
+| **Dimensione Soul** | **~3.8GB** (LoRA Rank 512, ~950M params) |
 | **Dataset Training** | **5GB** (Misto: Python, JS, C++, Go) |
 | **Tempo Training** | **8 ORE** (Singola Epoch) ⏱️ |
 | **Contesto** | 2048+ (Teoricamente infinito grazie a TCN) |