Mattimax commited on
Commit
5d39265
·
verified ·
1 Parent(s): 0145db8

Create README.md

Browse files
Files changed (1) hide show
  1. README.md +63 -0
README.md ADDED
@@ -0,0 +1,63 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ # Mattimax/DATA-AI_Chat_3_300M
2
+
3
+ ## Descrizione del modello
4
+ Mattimax/DATA-AI_Chat_3_300M è l'ultima versione di DATA-AI (Chat 3), un avanzato modello linguistico progettato per generare risposte conversazionali in italiano. Questa versione è stata ottimizzata utilizzando un modello di partenza pre-addestrato e un dataset specializzato per migliorare la qualità delle conversazioni quotidiane.
5
+
6
+ ## Modello di partenza
7
+ - **MODEL_NAME**: OuteAI/Lite-Oute-1-300M-Instruct
8
+ - **Dataset utilizzato per il fine-tuning**: ReDiX/everyday-conversations-ita
9
+
10
+ ## Log di training
11
+ Di seguito i log di training, che mostrano l'andamento della loss nel corso dei passi di addestramento:
12
+
13
+ | Step | Training Loss |
14
+ |------|---------------|
15
+ | 100 | 1.929900 |
16
+ | 200 | 1.719600 |
17
+ | 300 | 1.679100 |
18
+ | 400 | 1.648800 |
19
+ | 500 | 1.646400 |
20
+ | 600 | 1.625200 |
21
+ | 700 | 1.613700 |
22
+ | 800 | 1.607900 |
23
+ | 900 | 1.603400 |
24
+ | 1000 | 1.582100 |
25
+ | 1100 | 1.573100 |
26
+ | 1200 | 1.537400 |
27
+ | 1300 | 1.533200 |
28
+ | 1400 | 1.532900 |
29
+ | 1500 | 1.534300 |
30
+ | 1600 | 1.541800 |
31
+ | 1700 | 1.535100 |
32
+ | 1800 | 1.526000 |
33
+ | 1900 | 1.533800 |
34
+ | 2000 | 1.528400 |
35
+ | 2100 | 1.524600 |
36
+ | 2200 | 1.520500 |
37
+ | 2300 | 1.499000 |
38
+ | 2400 | 1.502200 |
39
+ | 2500 | 1.500600 |
40
+ | 2600 | 1.492100 |
41
+ | 2700 | 1.483200 |
42
+ | 2800 | 1.494000 |
43
+ | 2900 | 1.493900 |
44
+ | 3000 | 1.486500 |
45
+ | 3100 | 1.489500 |
46
+ | 3200 | 1.491100 |
47
+ | 3300 | 1.486700 |
48
+
49
+ ## Come utilizzare il modello
50
+ Per utilizzare Mattimax/DATA-AI_Chat_3_300M, assicurati di aver installato i pacchetti necessari e carica il modello con i seguenti comandi:
51
+
52
+ ```python
53
+ from transformers import AutoModel, AutoTokenizer
54
+
55
+ model_name = "Mattimax/DATA-AI_Chat_3_300M"
56
+ tokenizer = AutoTokenizer.from_pretrained(model_name)
57
+ model = AutoModel.from_pretrained(model_name)
58
+
59
+ # Esempio di utilizzo
60
+ input_text = "Come posso aiutarti oggi?"
61
+ inputs = tokenizer(input_text, return_tensors="pt")
62
+ outputs = model(**inputs)
63
+ ```