🇮🇹 Emma-5 (ONNX)

Overview

Emma-5 è un "mini" Large Language Model decoder-only sperimentale sviluppato da Egomnia S.p.A., progettato per lingua italiana.

Sito ufficiale: https://emma.egomnia.com

Il modello è pensato per:

  • comprensione contestuale moderata
  • generazione di contenuti di media-piccola complessità

Non è progettato per applicazioni safety-critical o reasoning avanzato multi-step.

Architettura

  • Tipo: GPT decoder-only
  • Transformer blocks: 28
  • Hidden size: 1.280
  • Attention heads: 16 query + 4 KV (GQA 4:1)
  • Head dimension: 80
  • Feed-forward dimension: 3.456 (SwiGLU, ff_mult 8/3)
  • Activation function: SwiGLU
  • Normalization: RMSNorm
  • Positional encoding: RoPE (theta 10.000)
  • Dropout: 0.0
  • Embeddings: tied (token embedding = lm_head)

Contesto e vocabolario

  • Context length: 2.048 token
  • Vocabulary size: 50.000 token
  • Tokenizer: SentencePiece BPE con byte fallback

Dataset di training

  • Codice: 40,48%
  • Generalista: 39,46%
  • Enciclopedico: 15,68%
  • Libri: 3,07%
  • Colloquiale: 0,73%
  • Politico: 0,55%

Training pipeline

  • Pretraining: 200.000 step
  • Fine-tuning: SFT (3 epoche)
  • DPO: disabilitato
  • Corpus pretraining: 54,36 GB raw (~10,8 miliardi token)

Export e ottimizzazione

  • Framework originale: PyTorch
  • Export: ONNX
  • Opset: 18
  • Quantizzazione: INT8
  • Peso modello ONNX: 2,46 GB (FP32)
  • Peso quantizzato INT8: ~560 MB

Uso non previsto

  • applicazioni mediche, legali o finanziarie critiche
  • sistemi ad alta affidabilità o mission critical
  • reasoning complesso multi-step
  • ricerca scientifica avanzata senza supervisione

Focus prestazionale

Il modello è ottimizzato per:

  • equilibrio tra qualità e latenza
  • inference su CPU/GPU entry-level
  • contesti leggeri

Limitazioni

  • capacità di reasoning ancora limitata rispetto a modelli di grandi dimensioni
  • possibile generazione di contenuti imprecisi o incompleti
  • sensibilità a prompt ambigui o molto lunghi
  • contesto limitato a 2.048 token

Licenza

Distribuito sotto licenza OpenRAIL-M, con eventuali vincoli derivati dalle licenze dei dataset utilizzati. Questa licenza consente l’uso, la modifica e la distribuzione del modello anche in ambito commerciale, imponendo tuttavia restrizioni sull’utilizzo in scenari potenzialmente dannosi, illegali o non etici, secondo i principi di Responsible AI e nel rispetto delle eventuali restrizioni derivanti dalle licenze dei dataset utilizzati. Si richiede esprezzamente di citare Egomnia S.p.A. come autore del modello in caso di utilizzo di quest'ultimo per prodotti, servizi, pubblicazioni o documentazione tecnica.

Autore

Egomnia S.p.A.

Sito ufficiale

https://emma.egomnia.com


Inference (ONNX Runtime)

import onnxruntime as ort

session = onnxruntime.InferenceSession("model.onnx")

outputs = session.run(
    None,
    {
        "input_ids": input_ids,
        "attention_mask": attention_mask
    }
)
Downloads last month
103
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for egomnia/emma-5

Quantizations
1 model