Mattimax
/

DACMini-IT

Text Generation

text-generation-inference

Model card Files Files and versions

Mattimax commited on Oct 14, 2025

Commit

584b4c2

·

verified ·

1 Parent(s): ee5a3de

Update README.md

Files changed (1) hide show

README.md +87 -3

README.md CHANGED Viewed

@@ -1,3 +1,87 @@
----
-license: mit
----

+---
+license: mit
+datasets:
+- Mattimax/DATA-AI_Conversation_ITA
+language:
+- it
+base_model:
+- Mattimax/DACMini
+library_name: transformers
+tags:
+- DAC
+- DATA-AI
+- data-ai
+---
+[![HuggingFace](https://img.shields.io/badge/HuggingFace-Mattimax-brightgreen)](https://huggingface.co/Mattimax)
+[![M.INC](https://img.shields.io/badge/M.INC-Labs-blue)](https://huggingface.co/MINC01)
+# Mattimax/DACMini-IT
+![Logo di DACMini](https://huggingface.co/Mattimax/DACMini/resolve/main/DACMini_Logo/DACMini_Logo.png)
+* **Autore:** [Mattimax](https://huggingface.co/Mattimax)
+* **Organizzazione:** [M.INC](https://huggingface.co/MINC01)
+* **Licenza:** MIT
+---
+## Descrizione
+**DACMini-IT** è un modello di linguaggio compatto e instruction tuned per **chat e dialogo in lingua italiana**.
+Basato sull’architettura **GPT-2 Small (italian adaptation)**, è progettato per essere rapido, leggero e facilmente distribuibile su dispositivi con risorse limitate.
+Rispetto a DACMini “base”, **DACMini-IT** è addestrato su dataset italiani conversazionali strutturati in formato *user-assistant*, ottimizzando la capacità di seguire istruzioni e gestire conversazioni multi-turno naturali.
+---
+## Dimensioni e caratteristiche tecniche
+* **Parametri:** 109M
+* **Architettura:** GPT-2 Small (italian adaptation)
+* **Lunghezza massima del contesto:** 512 token
+* **Numero di strati:** 12
+* **Numero di teste di attenzione:** 12
+* **Dimensione embedding:** 768
+* **Vocabolario:** ~50.000 token
+* **Quantizzazione:** supportata (8-bit / 4-bit opzionale con `bitsandbytes`)
+---
+## Dataset di addestramento
+Addestrato su **Mattimax/DATA-AI_Conversation_ITA**, un dataset italiano di dialoghi instruction tuned, contenente coppie *prompt-response* strutturate per favorire risposte coerenti, naturali e grammaticalmente corrette.
+---
+## Obiettivi
+* Chatbot in lingua italiana con capacità di seguire istruzioni.
+* Risposte concise, chiare e naturali in contesti multi-turno.
+* Applicazioni leggere o offline dove la dimensione del modello è un vincolo.
+---
+## Avvertenze e limitazioni
+* Modello **sperimentale**: può produrre errori logici o risposte non pertinenti.
+* Non addestrato su temi sensibili o contenuti specialistici.
+* Prestazioni limitate su conversazioni molto lunghe o prompt complessi.
+* Non destinato ad usi commerciali senza ulteriore validazione.
+---
+## Uso consigliato
+* Applicazioni chatbot leggere o offline in italiano.
+* Prototipazione e test di pipeline NLP italiane.
+* Generazione di risposte sintetiche e dataset per training o valutazione.
+---
+## Referenze
+* Dataset: [Mattimax/DATA-AI_Conversation_ITA](https://huggingface.co/datasets/Mattimax/DATA-AI_Conversation_ITA)
+* Modello di base: [DACMini / GroNLP/gpt2-small-italian](https://huggingface.co/Mattimax/DACMini)
+* Organizzazione: [M.INC](https://huggingface.co/MINC01)
+* Collezione: [Little_DAC Collection](https://huggingface.co/collections/Mattimax/little-dac-collection-68e11d19a5949d08e672b312)