RthItalia
/

Rth-lm-code-25b

+---
+license: cc-by-nc-4.0
+language:
+- en
+- it
+- py
+- js
+- cpp
+tags:
+- non-transformer
+- tcn
+- fractal
+- lora
+- genome
+- rth-code
+- zetagrid
+pipeline_tag: text-generation
+---
+# 💻 RTH-Code 25B — Code Specialist Soul
+> **"L'intelligenza è nell'architettura, non nelle GPU."**
+> Questa è la **Soul Specialista per il Codice** dell'ecosistema RTH-LM.
+> Stesso Genome (7B) di base, ma con una "anima" addestrata per programmare.
+⚠️ **PROOF OF CONCEPT** ⚠️
+Questa è una versione **BASE** creata per dimostrare l'efficienza scalare dell'architettura RTH-LM.
+- **Tempo di Training:** Solo **8 ore** su singola A40.
+- **Dataset:** Solo **5GB** di codice misto (Python, JS, C++, Go).
+- **Obiettivo:** Dimostrare che un Genome congelato può apprendere skills verticali complesse in tempi record.
+---
+## ⚡ Che cos'è?
+**RTH-Code 25B** non è un modello a sé stante. È una **Soul intercambiabile**.
+Invece di scaricare un modello da 30GB per ogni task, mantieni il **Genome congelato (7B)** e cambi solo la Soul (~950M parametri).
+Questa Soul è stata addestrata specificamente su:
+- **Python** (Data Science, Backend, Torch)
+- **JavaScript/TypeScript** (React, Node)
+- **C/C++** (Systems programming)
+- **Rust/Go**
+```mermaid
+graph TD
+    G["Genome 7B<br/>(Frozen Core)"]
+    G --> SC["🔹 Soul CODE<br/>Specialista Python/JS/C++"]
+    G --> SG["Soul Generalista<br/>Chat & Knowledge"]
+    G --> SL["Soul Legal/Medical<br/>(Future)"]
+```
+Basta **swappare** i file `.pt` (o usare il GGUF unificato) e il tuo modello passa da "filosofo" a "senior engineer" in millisecondi.
+---
+## 📊 Specifiche Tecniche
+| Feature | Dettaglio |
+|---|---|
+| **Architettura** | Fractal Gated Causal TCN (No Attention) |
+| **Parametri Totali** | 25B (7B Genome + 18B Virtuali) |
+| **Parametri Trainabili** | ~950M (LoRA Rank 512) |
+| **Dataset Training** | **5GB** (Misto: Python, JS, C++, Go) |
+| **Tempo Training** | **8 ORE** (Singola Epoch) ⏱️ |
+| **Contesto** | 2048+ (Teoricamente infinito grazie a TCN) |
+| **Loss Finale** | **1.20** ✅ |
+| **Hardware** | Addestrato su singola NVIDIA A40 (48GB) |
+---
+## 🛠️ Quickstart
+### Opzione 1: GGUF (Consigliata per Ollama/llama.cpp)
+Scarica `rth_lm_25b_code.gguf` da questo repo.
+```bash
+# Esegui con llama.cpp
+./llama-cli -m rth_lm_25b_code.gguf -p "def fibonacci(n):" -n 200
+# Oppure con Ollama (crea Modelfile)
+# FROM ./rth_lm_25b_code.gguf
+# SYSTEM "You are an expert coding assistant."
+```
+### Opzione 2: Python (Original PyTorch)
+Se hai già il repo [ZetaGrid](https://github.com/rthgit/ZetaGrid):
+```python
+from ZETAGRID_INFERENCE import ZetaGrid25B
+# Carica il Genome base
+model = ZetaGrid25B("zetagrid_25b_production.npy")
+# Inserisci la Soul del Codice
+model.load_soul("zeta25b_code_FINAL.pt")
+print(model.generate("def quicksort(arr):"))
+```
+---
+## 🧪 Performance & Capability
+RTH-Code eccelle in:
+1. **Code Completion**: Autocompletamento intelligente di funzioni e classi.
+2. **Refactoring**: Riscrittura di codice legacy in clean code.
+3. **Docstrings**: Generazione automatica di documentazione.
+4. **Unit Tests**: Scrittura di test `pytest`/`unittest`.
+*Nota: Essendo un'architettura No-Attention (TCN), ha un overhead di inferenza bassissimo e scala linearmente O(N) con la lunghezza del contesto.*
+---
+## 📜 Licenza & Citazione
+**CC BY-NC 4.0** — Ricerca e uso personale libero.
+Prodotto da **RTH Italia** (Research & Technology Hub).
+Autore: *Christian Quintino De Luca*.
+Per citare il paper originale:
+📖 **[RTH-LM: A Fractal Temporal Convolutional Language Model](https://zenodo.org/records/18622610)**
+---
+*Costruito per dimostrare che l'efficienza batte la forza bruta.*
+**RTH Italia**