DATA-AI_Chat_3_300M / README.md
Mattimax's picture
Create README.md
5d39265 verified

Mattimax/DATA-AI_Chat_3_300M

Descrizione del modello

Mattimax/DATA-AI_Chat_3_300M è l'ultima versione di DATA-AI (Chat 3), un avanzato modello linguistico progettato per generare risposte conversazionali in italiano. Questa versione è stata ottimizzata utilizzando un modello di partenza pre-addestrato e un dataset specializzato per migliorare la qualità delle conversazioni quotidiane.

Modello di partenza

  • MODEL_NAME: OuteAI/Lite-Oute-1-300M-Instruct
  • Dataset utilizzato per il fine-tuning: ReDiX/everyday-conversations-ita

Log di training

Di seguito i log di training, che mostrano l'andamento della loss nel corso dei passi di addestramento:

Step Training Loss
100 1.929900
200 1.719600
300 1.679100
400 1.648800
500 1.646400
600 1.625200
700 1.613700
800 1.607900
900 1.603400
1000 1.582100
1100 1.573100
1200 1.537400
1300 1.533200
1400 1.532900
1500 1.534300
1600 1.541800
1700 1.535100
1800 1.526000
1900 1.533800
2000 1.528400
2100 1.524600
2200 1.520500
2300 1.499000
2400 1.502200
2500 1.500600
2600 1.492100
2700 1.483200
2800 1.494000
2900 1.493900
3000 1.486500
3100 1.489500
3200 1.491100
3300 1.486700

Come utilizzare il modello

Per utilizzare Mattimax/DATA-AI_Chat_3_300M, assicurati di aver installato i pacchetti necessari e carica il modello con i seguenti comandi:

from transformers import AutoModel, AutoTokenizer

model_name = "Mattimax/DATA-AI_Chat_3_300M"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModel.from_pretrained(model_name)

# Esempio di utilizzo
input_text = "Come posso aiutarti oggi?"
inputs = tokenizer(input_text, return_tensors="pt")
outputs = model(**inputs)