Nick06888
/

Infortun-IA

Text Generation

workplace-safety

Model card Files Files and versions

Infortun-IA / README.md

Nick06888's picture

Upload folder using huggingface_hub

c132e82 verified 6 days ago

|

history blame contribute delete

3.36 kB

	---
	language:
	- it
	license: llama3.1
	base_model: meta-llama/Meta-Llama-3.1-8B-Instruct
	datasets:
	- Nick06888/PreventiData
	tags:
	- safety
	- workplace-safety
	- italian
	- fine-tuned
	- gguf
	- unsloth
	- lora
	model_name: Infortun-IA
	pipeline_tag: text-generation
	---

	# Infortun-IA

	Modello LLM fine-tuned per la prevenzione degli infortuni sul lavoro in Italia.

	Basato su Meta-Llama-3.1-8B-Instruct, addestrato su un dataset di oltre 10.000 casi reali di infortuni lavorativi italiani per fornire consulenza specializzata sulla sicurezza nei luoghi di lavoro.

	## Cosa fa

	Dato un scenario di infortunio (tipo, settore, causa, luogo...), il modello:

	- Analizza la dinamica dell'incidente
	- Identifica le cause e le mancanze
	- Fornisce raccomandazioni concrete e attuabili
	- Fa riferimento alla normativa italiana (D.Lgs. 81/2008)

	## Formati disponibili

	\| Formato \| Cartella \| Uso \|
	\|---\|---\|---\|
	\| GGUF Q4_K_M \| `gguf/` \| Ollama, llama.cpp, LM Studio \|
	\| Safetensors \| `Unsloth/` \| Transformers, vLLM, ulteriore fine-tuning \|

	## Uso rapido con Ollama

	```bash
	# Scarica il file GGUF e il Modelfile dalla cartella gguf/
	ollama create infortun-ia -f Modelfile
	ollama run infortun-ia
	```

	## Uso con Transformers

	```python
	from transformers import AutoModelForCausalLM, AutoTokenizer

	model = AutoModelForCausalLM.from_pretrained("Nick06888/Infortun-IA", subfolder="Unsloth")
	tokenizer = AutoTokenizer.from_pretrained("Nick06888/Infortun-IA", subfolder="Unsloth")

	messages = [
	{"role": "system", "content": "Sei un consulente esperto di sicurezza sul lavoro in Italia."},
	{"role": "user", "content": "Caduta da ponteggio in un cantiere edile, operaio senza imbracatura."}
	]

	inputs = tokenizer.apply_chat_template(messages, return_tensors="pt")
	outputs = model.generate(inputs, max_new_tokens=1024, temperature=0.7)
	print(tokenizer.decode(outputs[0], skip_special_tokens=True))
	```

	## Dettagli del training

	\| Parametro \| Valore \|
	\|---\|---\|
	\| Modello base \| Meta-Llama-3.1-8B-Instruct \|
	\| Metodo \| LoRA (rank 32) + Unsloth \|
	\| Dataset \| [PreventiData](https://huggingface.co/datasets/Nick06888/PreventiData) - 10.000+ casi di infortuni lavorativi italiani \|
	\| Epoche \| 2 \|
	\| Batch size effettivo \| 32 \|
	\| Learning rate \| 2e-4 \|
	\| Scheduler \| Cosine \|
	\| Precisione \| BF16, 4-bit quantization \|
	\| GPU \| NVIDIA L40S \|

	## Parametri estratti dal dataset

	Ogni caso di infortunio nel dataset contiene 8 parametri strutturati:

	1. Tipo di infortunio - caduta, taglio, schiacciamento, ustione...
	2. Causa - mancanza DPI, distrazione, guasto macchinario...
	3. Settore - edilizia, metalmeccanico, chimico, agricoltura...
	4. Parte del corpo - mano, schiena, occhi, piede...
	5. Gravita - lieve, moderato, grave, mortale
	6. DPI utilizzati - si, no, parziale + dettagli
	7. Luogo - cantiere, officina, magazzino, campo aperto...
	8. Azioni preventive - suggerimenti per prevenire l'infortunio

	## Limiti

	- Il modello fornisce consigli generali, non sostituisce un consulente RSPP certificato
	- Le risposte si basano su pattern appresi dai dati e potrebbero non coprire tutti gli scenari
	- Riferimenti normativi: il modello conosce il D.Lgs. 81/2008 ma potrebbe non essere aggiornato su modifiche successive

	## Licenza

	Questo modello eredita la licenza di Meta-Llama-3.1-8B-Instruct (Llama 3.1 Community License).