Infortun-IA / README.md

Nick06888

Upload folder using huggingface_hub

c132e82 verified 6 days ago

preview code

raw

history blame contribute delete

3.36 kB

metadata

language:
  - it
license: llama3.1
base_model: meta-llama/Meta-Llama-3.1-8B-Instruct
datasets:
  - Nick06888/PreventiData
tags:
  - safety
  - workplace-safety
  - italian
  - fine-tuned
  - gguf
  - unsloth
  - lora
model_name: Infortun-IA
pipeline_tag: text-generation

Infortun-IA

Modello LLM fine-tuned per la prevenzione degli infortuni sul lavoro in Italia.

Basato su Meta-Llama-3.1-8B-Instruct, addestrato su un dataset di oltre 10.000 casi reali di infortuni lavorativi italiani per fornire consulenza specializzata sulla sicurezza nei luoghi di lavoro.

Cosa fa

Dato un scenario di infortunio (tipo, settore, causa, luogo...), il modello:

Analizza la dinamica dell'incidente
Identifica le cause e le mancanze
Fornisce raccomandazioni concrete e attuabili
Fa riferimento alla normativa italiana (D.Lgs. 81/2008)

Formati disponibili

Formato	Cartella	Uso
GGUF Q4_K_M	`gguf/`	Ollama, llama.cpp, LM Studio
Safetensors	`Unsloth/`	Transformers, vLLM, ulteriore fine-tuning

Uso rapido con Ollama

# Scarica il file GGUF e il Modelfile dalla cartella gguf/
ollama create infortun-ia -f Modelfile
ollama run infortun-ia

Uso con Transformers

from transformers import AutoModelForCausalLM, AutoTokenizer

model = AutoModelForCausalLM.from_pretrained("Nick06888/Infortun-IA", subfolder="Unsloth")
tokenizer = AutoTokenizer.from_pretrained("Nick06888/Infortun-IA", subfolder="Unsloth")

messages = [
    {"role": "system", "content": "Sei un consulente esperto di sicurezza sul lavoro in Italia."},
    {"role": "user", "content": "Caduta da ponteggio in un cantiere edile, operaio senza imbracatura."}
]

inputs = tokenizer.apply_chat_template(messages, return_tensors="pt")
outputs = model.generate(inputs, max_new_tokens=1024, temperature=0.7)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))

Dettagli del training

Parametro	Valore
Modello base	Meta-Llama-3.1-8B-Instruct
Metodo	LoRA (rank 32) + Unsloth
Dataset	PreventiData - 10.000+ casi di infortuni lavorativi italiani
Epoche	2
Batch size effettivo	32
Learning rate	2e-4
Scheduler	Cosine
Precisione	BF16, 4-bit quantization
GPU	NVIDIA L40S

Parametri estratti dal dataset

Ogni caso di infortunio nel dataset contiene 8 parametri strutturati:

Tipo di infortunio - caduta, taglio, schiacciamento, ustione...
Causa - mancanza DPI, distrazione, guasto macchinario...
Settore - edilizia, metalmeccanico, chimico, agricoltura...
Parte del corpo - mano, schiena, occhi, piede...
Gravita - lieve, moderato, grave, mortale
DPI utilizzati - si, no, parziale + dettagli
Luogo - cantiere, officina, magazzino, campo aperto...
Azioni preventive - suggerimenti per prevenire l'infortunio

Limiti

Il modello fornisce consigli generali, non sostituisce un consulente RSPP certificato
Le risposte si basano su pattern appresi dai dati e potrebbero non coprire tutti gli scenari
Riferimenti normativi: il modello conosce il D.Lgs. 81/2008 ma potrebbe non essere aggiornato su modifiche successive

Licenza

Questo modello eredita la licenza di Meta-Llama-3.1-8B-Instruct (Llama 3.1 Community License).