Infortun-IA / README.md
Nick06888's picture
Upload folder using huggingface_hub
c132e82 verified
---
language:
- it
license: llama3.1
base_model: meta-llama/Meta-Llama-3.1-8B-Instruct
datasets:
- Nick06888/PreventiData
tags:
- safety
- workplace-safety
- italian
- fine-tuned
- gguf
- unsloth
- lora
model_name: Infortun-IA
pipeline_tag: text-generation
---
# Infortun-IA
Modello LLM fine-tuned per la **prevenzione degli infortuni sul lavoro** in Italia.
Basato su Meta-Llama-3.1-8B-Instruct, addestrato su un dataset di oltre 10.000 casi reali di infortuni lavorativi italiani per fornire consulenza specializzata sulla sicurezza nei luoghi di lavoro.
## Cosa fa
Dato un scenario di infortunio (tipo, settore, causa, luogo...), il modello:
- Analizza la dinamica dell'incidente
- Identifica le cause e le mancanze
- Fornisce raccomandazioni concrete e attuabili
- Fa riferimento alla normativa italiana (D.Lgs. 81/2008)
## Formati disponibili
| Formato | Cartella | Uso |
|---|---|---|
| GGUF Q4_K_M | `gguf/` | Ollama, llama.cpp, LM Studio |
| Safetensors | `Unsloth/` | Transformers, vLLM, ulteriore fine-tuning |
## Uso rapido con Ollama
```bash
# Scarica il file GGUF e il Modelfile dalla cartella gguf/
ollama create infortun-ia -f Modelfile
ollama run infortun-ia
```
## Uso con Transformers
```python
from transformers import AutoModelForCausalLM, AutoTokenizer
model = AutoModelForCausalLM.from_pretrained("Nick06888/Infortun-IA", subfolder="Unsloth")
tokenizer = AutoTokenizer.from_pretrained("Nick06888/Infortun-IA", subfolder="Unsloth")
messages = [
{"role": "system", "content": "Sei un consulente esperto di sicurezza sul lavoro in Italia."},
{"role": "user", "content": "Caduta da ponteggio in un cantiere edile, operaio senza imbracatura."}
]
inputs = tokenizer.apply_chat_template(messages, return_tensors="pt")
outputs = model.generate(inputs, max_new_tokens=1024, temperature=0.7)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))
```
## Dettagli del training
| Parametro | Valore |
|---|---|
| Modello base | Meta-Llama-3.1-8B-Instruct |
| Metodo | LoRA (rank 32) + Unsloth |
| Dataset | [PreventiData](https://huggingface.co/datasets/Nick06888/PreventiData) - 10.000+ casi di infortuni lavorativi italiani |
| Epoche | 2 |
| Batch size effettivo | 32 |
| Learning rate | 2e-4 |
| Scheduler | Cosine |
| Precisione | BF16, 4-bit quantization |
| GPU | NVIDIA L40S |
## Parametri estratti dal dataset
Ogni caso di infortunio nel dataset contiene 8 parametri strutturati:
1. **Tipo di infortunio** - caduta, taglio, schiacciamento, ustione...
2. **Causa** - mancanza DPI, distrazione, guasto macchinario...
3. **Settore** - edilizia, metalmeccanico, chimico, agricoltura...
4. **Parte del corpo** - mano, schiena, occhi, piede...
5. **Gravita** - lieve, moderato, grave, mortale
6. **DPI utilizzati** - si, no, parziale + dettagli
7. **Luogo** - cantiere, officina, magazzino, campo aperto...
8. **Azioni preventive** - suggerimenti per prevenire l'infortunio
## Limiti
- Il modello fornisce consigli generali, non sostituisce un consulente RSPP certificato
- Le risposte si basano su pattern appresi dai dati e potrebbero non coprire tutti gli scenari
- Riferimenti normativi: il modello conosce il D.Lgs. 81/2008 ma potrebbe non essere aggiornato su modifiche successive
## Licenza
Questo modello eredita la licenza di Meta-Llama-3.1-8B-Instruct (Llama 3.1 Community License).