| # Mattimax/DATA-AI_Chat_3_300M | |
| ## Descrizione del modello | |
| Mattimax/DATA-AI_Chat_3_300M è l'ultima versione di DATA-AI (Chat 3), un avanzato modello linguistico progettato per generare risposte conversazionali in italiano. Questa versione è stata ottimizzata utilizzando un modello di partenza pre-addestrato e un dataset specializzato per migliorare la qualità delle conversazioni quotidiane. | |
| ## Modello di partenza | |
| - **MODEL_NAME**: OuteAI/Lite-Oute-1-300M-Instruct | |
| - **Dataset utilizzato per il fine-tuning**: ReDiX/everyday-conversations-ita | |
| ## Log di training | |
| Di seguito i log di training, che mostrano l'andamento della loss nel corso dei passi di addestramento: | |
| | Step | Training Loss | | |
| |------|---------------| | |
| | 100 | 1.929900 | | |
| | 200 | 1.719600 | | |
| | 300 | 1.679100 | | |
| | 400 | 1.648800 | | |
| | 500 | 1.646400 | | |
| | 600 | 1.625200 | | |
| | 700 | 1.613700 | | |
| | 800 | 1.607900 | | |
| | 900 | 1.603400 | | |
| | 1000 | 1.582100 | | |
| | 1100 | 1.573100 | | |
| | 1200 | 1.537400 | | |
| | 1300 | 1.533200 | | |
| | 1400 | 1.532900 | | |
| | 1500 | 1.534300 | | |
| | 1600 | 1.541800 | | |
| | 1700 | 1.535100 | | |
| | 1800 | 1.526000 | | |
| | 1900 | 1.533800 | | |
| | 2000 | 1.528400 | | |
| | 2100 | 1.524600 | | |
| | 2200 | 1.520500 | | |
| | 2300 | 1.499000 | | |
| | 2400 | 1.502200 | | |
| | 2500 | 1.500600 | | |
| | 2600 | 1.492100 | | |
| | 2700 | 1.483200 | | |
| | 2800 | 1.494000 | | |
| | 2900 | 1.493900 | | |
| | 3000 | 1.486500 | | |
| | 3100 | 1.489500 | | |
| | 3200 | 1.491100 | | |
| | 3300 | 1.486700 | | |
| ## Come utilizzare il modello | |
| Per utilizzare Mattimax/DATA-AI_Chat_3_300M, assicurati di aver installato i pacchetti necessari e carica il modello con i seguenti comandi: | |
| ```python | |
| from transformers import AutoModel, AutoTokenizer | |
| model_name = "Mattimax/DATA-AI_Chat_3_300M" | |
| tokenizer = AutoTokenizer.from_pretrained(model_name) | |
| model = AutoModel.from_pretrained(model_name) | |
| # Esempio di utilizzo | |
| input_text = "Come posso aiutarti oggi?" | |
| inputs = tokenizer(input_text, return_tensors="pt") | |
| outputs = model(**inputs) | |
| ``` |