File size: 9,778 Bytes

---
tags:
- sentence-transformers
- cross-encoder
- reranker
- generated_from_trainer
- dataset_size:474242
- loss:CrossEntropyLoss
base_model: dbmdz/bert-base-italian-uncased
pipeline_tag: text-classification
library_name: sentence-transformers
---
# 🍳 Horeca Cucine Industriali – Modello NLI Specializzato (Italiano)

## 📌 Panoramica

Questo modello NLI (Natural Language Inference) è **il primo modello open-source specializzato esclusivamente sull’analisi semantica di schede tecniche di CUCINE INDUSTRIALI e PIANI COTTURA**.

✅ Non è un modello generalista   

Il modello è in grado di stabilire se una caratteristica **è presente (entailment), assente (contradiction) o non menzionata (neutral)** nella descrizione tecnica di un prodotto.

---

## 🎯 Obiettivo del Modello

Consentire a sistemi di ricerca, Q&A o RAG di:

- Comprendere realmente le schede prodotto di cucine professionali
- Verificare se una certa caratteristica è presente o meno
- Estrarre informazioni in modo intelligente tramite logica NLI

---

## ✅ Caratteristiche Analizzate

Il modello è stato addestrato per riconoscere e validare le seguenti caratteristiche:

- Numero di zone di cottura (es. 4 fuochi, 6 fuochi, 4 piastre)
- Tipo di cottura (gas, elettrico, induzione)
- Disposizione (su forno, a banco, top)
- Dimensioni (larghezza, profondità)
- Struttura / accessori (vano forno, vano aperto, mobile chiuso, alzatina, ecc.)

---

## 💡 Perché è Unico?

| Modello | Specializzazione | Lingua | Applicazione reale |
|--------|------------------|--------|--------------------|
| GPT / Llama / generalisti | ❌ No | 🌐 Multi | ❓ Limitata |
| Classici modelli NLI | ❌ No | ❓ Spesso EN | ❌ Non capiscono il dominio tecnico |
| **QUESTO MODELLO** | ✅ SOLO cucine e piani cottura | ✅ Italiano | ✅ Pensato per industria Ho.Re.Ca |

---

## 🔧 Architettura

- **Base model:**  `dbmdz/bert-base-italian-uncased`)
- **Task:** Natural Language Inference (3 classi: entailment, contradiction, neutral)
- **Linguaggio:** Italiano
- **Dominio:** Schede tecniche di cucine industriali

---

## 🧾 Formato Input / Output

Questo è un modello NLI: riceve in input **premessa + ipotesi**.

**Esempio:**

- Premessa:  
  `Cucina a gas 4 fuochi con vano forno statico`

- Ipotesi:  
  `la cucina ha un forno`

- Output:  
  `entailment`

---

## 🧪 Esempio d’Uso (Python)

## Usage

### Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

```bash
pip install -U sentence-transformers
```

Then you can load this model and run inference.
```python
from sentence_transformers import CrossEncoder

# Download from the 🤗 Hub
model = CrossEncoder("software-si/kitchen-it-nli")
# Get scores for pairs of texts
pairs = [
    ['unità di cottura dispositivo a gas, sei fuochi, con forno gas incluso,', 'la cucina è disposta su top'],
    ['cucina piastre quadrate incluse, posizionata su forno, piano a induzione, profondità utile 90 cm,', 'la cucina ha un forno alimentato a gas'],
    ['modulo cucina misure 70 cm di profondità, forno alimentato elettricamente, dispone di 6 fuochi,', 'la cucina ha un forno'],
    ['modulo cucina con piastre tonde, cottura elettrica, dotata di due zone di cottura, dimensione teglie di gn1/1', 'le zone cottura disponibili sono quattro'],
    ['piano cottura quattro zone separate, modello in versione top, piastre di forma tonda, di settanta centimetri di profondità,', 'disponibile in più varianti estetiche'],
]
scores = model.predict(pairs)
print(scores.shape)
# (5, 3)
```

## Training Details

### Training Dataset

#### json

* Dataset: json
* Size: 474,242 training samples
* Columns: <code>premises</code>, <code>hypothesis</code>, and <code>labels</code>
* Approximate statistics based on the first 1000 samples:
  |         | premises                                                                                         | hypothesis                                                                                     | labels                                                             |
  |:--------|:-------------------------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------------------|:-------------------------------------------------------------------|
  | type    | string                                                                                           | string                                                                                         | int                                                                |
  | details | <ul><li>min: 37 characters</li><li>mean: 101.06 characters</li><li>max: 160 characters</li></ul> | <ul><li>min: 12 characters</li><li>mean: 34.38 characters</li><li>max: 53 characters</li></ul> | <ul><li>0: ~38.30%</li><li>1: ~38.70%</li><li>2: ~23.00%</li></ul> |
* Samples:
  | premises                                                                                                                            | hypothesis                                                         | labels         |
  |:------------------------------------------------------------------------------------------------------------------------------------|:-------------------------------------------------------------------|:---------------|
  | <code>cucina teglia dimensione gn1/1 versione con forno incorporato, alimentazione a induzione, piastre tonde preinstallate,</code> | <code>garantita da controlli rigorosi in fase di produzione</code> | <code>2</code> |
  | <code>unità di cottura fornita di piastre tonde, sopra vano, dimensione anteriore 90 cm, configurazione a 2 zone,</code>            | <code>la cucina dispone di un forno</code>                         | <code>0</code> |
  | <code>cucina piano a gas, quattro punti cottura, dimensione teglie di gn2/1</code>                                                  | <code>la cucina ha quattro zone cottura</code>                     | <code>1</code> |
* Loss: [<code>CrossEntropyLoss</code>](https://sbert.net/docs/package_reference/cross_encoder/losses.html#crossentropyloss)

### Evaluation Dataset

#### json

* Dataset: json
* Size: 142,272 evaluation samples
* Columns: <code>premises</code>, <code>hypothesis</code>, and <code>labels</code>
* Approximate statistics based on the first 1000 samples:
  |         | premises                                                                                         | hypothesis                                                                                     | labels                                                             |
  |:--------|:-------------------------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------------------|:-------------------------------------------------------------------|
  | type    | string                                                                                           | string                                                                                         | int                                                                |
  | details | <ul><li>min: 41 characters</li><li>mean: 102.64 characters</li><li>max: 149 characters</li></ul> | <ul><li>min: 12 characters</li><li>mean: 34.15 characters</li><li>max: 53 characters</li></ul> | <ul><li>0: ~38.40%</li><li>1: ~39.50%</li><li>2: ~22.10%</li></ul> |
* Samples:
  | premises                                                                                                       | hypothesis                                          | labels         |
  |:---------------------------------------------------------------------------------------------------------------|:----------------------------------------------------|:---------------|
  | <code>unità di cottura dispositivo a gas, sei fuochi, con forno gas incluso,</code>                            | <code>la cucina è disposta su top</code>            | <code>0</code> |
  | <code>cucina piastre quadrate incluse, posizionata su forno, piano a induzione, profondità utile 90 cm,</code> | <code>la cucina ha un forno alimentato a gas</code> | <code>0</code> |
  | <code>modulo cucina misure 70 cm di profondità, forno alimentato elettricamente, dispone di 6 fuochi,</code>   | <code>la cucina ha un forno</code>                  | <code>1</code> |
* Loss: [<code>CrossEntropyLoss</code>](https://sbert.net/docs/package_reference/cross_encoder/losses.html#crossentropyloss)


### Training Logs
| Epoch  | Step  | Training Loss | Validation Loss |
|:------:|:-----:|:-------------:|:---------------:|
| 0.1349 | 2000  | 0.7725        | 0.4394          |
| 0.2699 | 4000  | 0.3298        | 0.1768          |
| 0.4048 | 6000  | 0.1659        | 0.1137          |
| 0.5398 | 8000  | 0.113         | 0.0818          |
| 0.6747 | 10000 | 0.0784        | 0.0529          |
| 0.8097 | 12000 | 0.053         | 0.0391          |
| 0.9446 | 14000 | 0.0421        | 0.0328          |


### Framework Versions
- Python: 3.12.3
- Sentence Transformers: 5.1.1
- Transformers: 4.57.0
- PyTorch: 2.8.0+cu128
- Accelerate: 1.10.1
- Datasets: 4.1.1
- Tokenizers: 0.22.1

## Citation

### BibTeX

#### Sentence Transformers
```bibtex
@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}
```