Infortun-IA / README.md
Nick06888's picture
Upload folder using huggingface_hub
c132e82 verified
metadata
language:
  - it
license: llama3.1
base_model: meta-llama/Meta-Llama-3.1-8B-Instruct
datasets:
  - Nick06888/PreventiData
tags:
  - safety
  - workplace-safety
  - italian
  - fine-tuned
  - gguf
  - unsloth
  - lora
model_name: Infortun-IA
pipeline_tag: text-generation

Infortun-IA

Modello LLM fine-tuned per la prevenzione degli infortuni sul lavoro in Italia.

Basato su Meta-Llama-3.1-8B-Instruct, addestrato su un dataset di oltre 10.000 casi reali di infortuni lavorativi italiani per fornire consulenza specializzata sulla sicurezza nei luoghi di lavoro.

Cosa fa

Dato un scenario di infortunio (tipo, settore, causa, luogo...), il modello:

  • Analizza la dinamica dell'incidente
  • Identifica le cause e le mancanze
  • Fornisce raccomandazioni concrete e attuabili
  • Fa riferimento alla normativa italiana (D.Lgs. 81/2008)

Formati disponibili

Formato Cartella Uso
GGUF Q4_K_M gguf/ Ollama, llama.cpp, LM Studio
Safetensors Unsloth/ Transformers, vLLM, ulteriore fine-tuning

Uso rapido con Ollama

# Scarica il file GGUF e il Modelfile dalla cartella gguf/
ollama create infortun-ia -f Modelfile
ollama run infortun-ia

Uso con Transformers

from transformers import AutoModelForCausalLM, AutoTokenizer

model = AutoModelForCausalLM.from_pretrained("Nick06888/Infortun-IA", subfolder="Unsloth")
tokenizer = AutoTokenizer.from_pretrained("Nick06888/Infortun-IA", subfolder="Unsloth")

messages = [
    {"role": "system", "content": "Sei un consulente esperto di sicurezza sul lavoro in Italia."},
    {"role": "user", "content": "Caduta da ponteggio in un cantiere edile, operaio senza imbracatura."}
]

inputs = tokenizer.apply_chat_template(messages, return_tensors="pt")
outputs = model.generate(inputs, max_new_tokens=1024, temperature=0.7)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))

Dettagli del training

Parametro Valore
Modello base Meta-Llama-3.1-8B-Instruct
Metodo LoRA (rank 32) + Unsloth
Dataset PreventiData - 10.000+ casi di infortuni lavorativi italiani
Epoche 2
Batch size effettivo 32
Learning rate 2e-4
Scheduler Cosine
Precisione BF16, 4-bit quantization
GPU NVIDIA L40S

Parametri estratti dal dataset

Ogni caso di infortunio nel dataset contiene 8 parametri strutturati:

  1. Tipo di infortunio - caduta, taglio, schiacciamento, ustione...
  2. Causa - mancanza DPI, distrazione, guasto macchinario...
  3. Settore - edilizia, metalmeccanico, chimico, agricoltura...
  4. Parte del corpo - mano, schiena, occhi, piede...
  5. Gravita - lieve, moderato, grave, mortale
  6. DPI utilizzati - si, no, parziale + dettagli
  7. Luogo - cantiere, officina, magazzino, campo aperto...
  8. Azioni preventive - suggerimenti per prevenire l'infortunio

Limiti

  • Il modello fornisce consigli generali, non sostituisce un consulente RSPP certificato
  • Le risposte si basano su pattern appresi dai dati e potrebbero non coprire tutti gli scenari
  • Riferimenti normativi: il modello conosce il D.Lgs. 81/2008 ma potrebbe non essere aggiornato su modifiche successive

Licenza

Questo modello eredita la licenza di Meta-Llama-3.1-8B-Instruct (Llama 3.1 Community License).