luctensorflow
/

mt-topics

Text Classification

Model card Files Files and versions

luctensorflow commited on Aug 28, 2025

Commit

0231199

·

verified ·

1 Parent(s): 0f8fcb2

Update README.md

Files changed (1) hide show

README.md +43 -3

README.md CHANGED Viewed

@@ -1,8 +1,33 @@
----
 license: apache-2.0
----
-# Modello Fine-Tunato MT5
 Questo modello si basa su **MT5**, un modello pre-addestrato di **Google**, che è stato fine-tunato utilizzando un dataset personalizzato per [scopo specifico]. Il modello originale MT5 è disponibile sotto la **licenza Apache 2.0**.
 ## Licenza del modello fine-tunato
@@ -13,3 +38,18 @@ Questo modello è attualmente **sperimentale**. Le sue performance potrebbero no
 ## Attribuzioni
 Il modello si basa su **MT5** di **Google**. Il codice originale è disponibile su [Google Research GitHub](https://github.com/google-research/mt5).

 license: apache-2.0
+tags:
+  - mt5
+  - fine-tuned
+  - text-classification
+  - summarization
+  - multi-lingual
+language:
+  - en
+  - it
+  - es
+  - de
+datasets:
+  - custom_dataset
+metrics:
+  - accuracy
+  - f1
+  - bleu
+pipeline_tag: text-classification
+base_model: google/mt5-small
+model_type: mt5
+library_name: transformers
+eval_results:
+  - accuracy: 0.85
+  - f1: 0.87
+  - bleu: 0.75
+new_version: true
+# Descrizione
+# Modello Fine-Tunato MT5
 Questo modello si basa su **MT5**, un modello pre-addestrato di **Google**, che è stato fine-tunato utilizzando un dataset personalizzato per [scopo specifico]. Il modello originale MT5 è disponibile sotto la **licenza Apache 2.0**.
 ## Licenza del modello fine-tunato
 ## Attribuzioni
 Il modello si basa su **MT5** di **Google**. Il codice originale è disponibile su [Google Research GitHub](https://github.com/google-research/mt5).
+## Come usare il modello
+Per usare il modello con Hugging Face `transformers`:
+```python
+from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
+model_name = "luctensorflow/mt-topics"
+tokenizer = AutoTokenizer.from_pretrained(model_name)
+model = AutoModelForSeq2SeqLM.from_pretrained(model_name)
+input_text = "Qual è la capitale d'Italia?"
+inputs = tokenizer(input_text, return_tensors="pt")
+outputs = model.generate(**inputs)
+print(tokenizer.decode(outputs[0], skip_special_tokens=True))