File size: 2,073 Bytes
5d39265
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
# Mattimax/DATA-AI_Chat_3_300M

## Descrizione del modello
Mattimax/DATA-AI_Chat_3_300M è l'ultima versione di DATA-AI (Chat 3), un avanzato modello linguistico progettato per generare risposte conversazionali in italiano. Questa versione è stata ottimizzata utilizzando un modello di partenza pre-addestrato e un dataset specializzato per migliorare la qualità delle conversazioni quotidiane.

## Modello di partenza
- **MODEL_NAME**: OuteAI/Lite-Oute-1-300M-Instruct
- **Dataset utilizzato per il fine-tuning**: ReDiX/everyday-conversations-ita

## Log di training
Di seguito i log di training, che mostrano l'andamento della loss nel corso dei passi di addestramento:

| Step | Training Loss |
|------|---------------|
| 100  | 1.929900      |
| 200  | 1.719600      |
| 300  | 1.679100      |
| 400  | 1.648800      |
| 500  | 1.646400      |
| 600  | 1.625200      |
| 700  | 1.613700      |
| 800  | 1.607900      |
| 900  | 1.603400      |
| 1000 | 1.582100      |
| 1100 | 1.573100      |
| 1200 | 1.537400      |
| 1300 | 1.533200      |
| 1400 | 1.532900      |
| 1500 | 1.534300      |
| 1600 | 1.541800      |
| 1700 | 1.535100      |
| 1800 | 1.526000      |
| 1900 | 1.533800      |
| 2000 | 1.528400      |
| 2100 | 1.524600      |
| 2200 | 1.520500      |
| 2300 | 1.499000      |
| 2400 | 1.502200      |
| 2500 | 1.500600      |
| 2600 | 1.492100      |
| 2700 | 1.483200      |
| 2800 | 1.494000      |
| 2900 | 1.493900      |
| 3000 | 1.486500      |
| 3100 | 1.489500      |
| 3200 | 1.491100      |
| 3300 | 1.486700      |

## Come utilizzare il modello
Per utilizzare Mattimax/DATA-AI_Chat_3_300M, assicurati di aver installato i pacchetti necessari e carica il modello con i seguenti comandi:

```python
from transformers import AutoModel, AutoTokenizer

model_name = "Mattimax/DATA-AI_Chat_3_300M"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModel.from_pretrained(model_name)

# Esempio di utilizzo
input_text = "Come posso aiutarti oggi?"
inputs = tokenizer(input_text, return_tensors="pt")
outputs = model(**inputs)
```