Create README.md
Browse files
README.md
ADDED
|
@@ -0,0 +1,63 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
# Mattimax/DATA-AI_Chat_3_300M
|
| 2 |
+
|
| 3 |
+
## Descrizione del modello
|
| 4 |
+
Mattimax/DATA-AI_Chat_3_300M è l'ultima versione di DATA-AI (Chat 3), un avanzato modello linguistico progettato per generare risposte conversazionali in italiano. Questa versione è stata ottimizzata utilizzando un modello di partenza pre-addestrato e un dataset specializzato per migliorare la qualità delle conversazioni quotidiane.
|
| 5 |
+
|
| 6 |
+
## Modello di partenza
|
| 7 |
+
- **MODEL_NAME**: OuteAI/Lite-Oute-1-300M-Instruct
|
| 8 |
+
- **Dataset utilizzato per il fine-tuning**: ReDiX/everyday-conversations-ita
|
| 9 |
+
|
| 10 |
+
## Log di training
|
| 11 |
+
Di seguito i log di training, che mostrano l'andamento della loss nel corso dei passi di addestramento:
|
| 12 |
+
|
| 13 |
+
| Step | Training Loss |
|
| 14 |
+
|------|---------------|
|
| 15 |
+
| 100 | 1.929900 |
|
| 16 |
+
| 200 | 1.719600 |
|
| 17 |
+
| 300 | 1.679100 |
|
| 18 |
+
| 400 | 1.648800 |
|
| 19 |
+
| 500 | 1.646400 |
|
| 20 |
+
| 600 | 1.625200 |
|
| 21 |
+
| 700 | 1.613700 |
|
| 22 |
+
| 800 | 1.607900 |
|
| 23 |
+
| 900 | 1.603400 |
|
| 24 |
+
| 1000 | 1.582100 |
|
| 25 |
+
| 1100 | 1.573100 |
|
| 26 |
+
| 1200 | 1.537400 |
|
| 27 |
+
| 1300 | 1.533200 |
|
| 28 |
+
| 1400 | 1.532900 |
|
| 29 |
+
| 1500 | 1.534300 |
|
| 30 |
+
| 1600 | 1.541800 |
|
| 31 |
+
| 1700 | 1.535100 |
|
| 32 |
+
| 1800 | 1.526000 |
|
| 33 |
+
| 1900 | 1.533800 |
|
| 34 |
+
| 2000 | 1.528400 |
|
| 35 |
+
| 2100 | 1.524600 |
|
| 36 |
+
| 2200 | 1.520500 |
|
| 37 |
+
| 2300 | 1.499000 |
|
| 38 |
+
| 2400 | 1.502200 |
|
| 39 |
+
| 2500 | 1.500600 |
|
| 40 |
+
| 2600 | 1.492100 |
|
| 41 |
+
| 2700 | 1.483200 |
|
| 42 |
+
| 2800 | 1.494000 |
|
| 43 |
+
| 2900 | 1.493900 |
|
| 44 |
+
| 3000 | 1.486500 |
|
| 45 |
+
| 3100 | 1.489500 |
|
| 46 |
+
| 3200 | 1.491100 |
|
| 47 |
+
| 3300 | 1.486700 |
|
| 48 |
+
|
| 49 |
+
## Come utilizzare il modello
|
| 50 |
+
Per utilizzare Mattimax/DATA-AI_Chat_3_300M, assicurati di aver installato i pacchetti necessari e carica il modello con i seguenti comandi:
|
| 51 |
+
|
| 52 |
+
```python
|
| 53 |
+
from transformers import AutoModel, AutoTokenizer
|
| 54 |
+
|
| 55 |
+
model_name = "Mattimax/DATA-AI_Chat_3_300M"
|
| 56 |
+
tokenizer = AutoTokenizer.from_pretrained(model_name)
|
| 57 |
+
model = AutoModel.from_pretrained(model_name)
|
| 58 |
+
|
| 59 |
+
# Esempio di utilizzo
|
| 60 |
+
input_text = "Come posso aiutarti oggi?"
|
| 61 |
+
inputs = tokenizer(input_text, return_tensors="pt")
|
| 62 |
+
outputs = model(**inputs)
|
| 63 |
+
```
|