Spaces:
Running
Running
File size: 8,000 Bytes
632bab6 e3ef569 632bab6 | 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 | # GraphoLab: quando l'intelligenza artificiale incontra la grafologia forense
<!--
COME PUBBLICARE SU LINKEDIN:
1. Apri https://markdowntolinkedin.com
2. Incolla il contenuto di questo file (dal titolo in poi)
3. Copia il testo formattato risultante
4. Su LinkedIn → "Scrivi un articolo" → incolla il testo
5. Carica docs/linkedin_cover.png come immagine di copertina (1920×1080)
6. Usa il titolo H1 come titolo dell'articolo LinkedIn
-->
---
Immaginate la scena: uno studio legale, un fascicolo di testamento, e un perito grafologo con la lente d'ingrandimento in mano. La domanda è semplice, ma la risposta può valere milioni di euro — o cambiare il destino di un processo penale: **questa firma è autentica?**
Per decenni, rispondere a questa domanda ha richiesto anni di esperienza, ore di lavoro manuale e, inevitabilmente, un certo grado di soggettività. Oggi, l'intelligenza artificiale offre strumenti nuovi per supportare, accelerare e rendere più rigoroso questo processo.
Ho costruito **GraphoLab** — una raccolta di otto laboratori dimostrativi open source che mostrano come machine learning e computer vision possono essere applicati alla grafologia forense.
---
## Il problema: i limiti dell'analisi tradizionale
La grafologia forense è una disciplina seria e consolidata. Ma come ogni processo manuale, soffre di alcune limitazioni strutturali:
- **Soggettività**: due periti esperti possono giungere a conclusioni diverse sullo stesso documento
- **Scalabilità**: trovare una firma specifica in diecimila pagine scansionate richiede settimane
- **Riproducibilità**: le osservazioni qualitative ("la pressione del tratto sembra diversa") sono difficili da verificare in modo indipendente
- **Velocità**: in procedimenti giudiziari complessi, i tempi dell'analisi manuale possono diventare un collo di bottiglia
L'AI non elimina questi problemi — ma li riduce significativamente, portando misurazioni oggettive accanto all'esperienza umana.
---
## La soluzione: GraphoLab
GraphoLab è un progetto open source che integra sette tecnologie AI in una piattaforma dimostrativa unificata, accessibile via browser grazie a un'app **Gradio**. Ogni laboratorio affronta un compito specifico della grafologia forense.
### Gli otto laboratori
| Lab | Funzionalità | Tecnologia AI |
|-----|-------------|---------------|
| 01 | Introduzione concettuale | — |
| 02 | Riconoscimento testo manoscritto (HTR) | TrOCR / EasyOCR |
| 03 | Verifica autenticità firma | SigNet (Siamese Network) |
| 04 | Rilevamento firma nei documenti | Conditional DETR fine-tuned |
| 05 | Identificazione dello scrittore | HOG + LBP + SVM |
| 06 | Analisi caratteristiche grafologiche | OpenCV + signal processing |
| 07 | Riconoscimento entità nominate (NER) | BERT-NER multilingue |
| 08 | OCR avanzato su corsivo italiano | dots.ocr (VLM 1.7B) |
---
## Approfondimento 1: verificare una firma senza conoscere il firmatario
Una delle domande più frequenti che ricevo: *"SigNet funziona solo con firme già presenti nel database di training?"*
La risposta è no — e la ragione è architetturale.
SigNet usa il **metric learning** (rete siamese con contrastive loss), non un classificatore tradizionale. Un classificatore impara "chi è la persona X" e non può generalizzare a identità mai viste. Un modello metrico, invece, impara a rispondere a una domanda diversa: *"queste due firme provengono dalla stessa mano?"*
Questa domanda è **indipendente dall'identità** del firmatario. SigNet può quindi essere applicata a qualsiasi coppia di firme — anche di persone mai viste durante il training — producendo uno score di similarità coseno che il perito può utilizzare come evidenza quantitativa.
**Le limitazioni esistono e vanno comunicate chiaramente:**
- Il training set (GPDS) contiene principalmente firme brasiliane/portoghesi: stili molto distanti dalla distribuzione di training potrebbero essere meno accurati
- La soglia decisionale (0.35) è calibrata su CEDAR e potrebbe richiedere aggiustamenti per nuovi contesti
- Il sistema è uno strumento di screening, non una prova autonoma: il giudizio finale spetta sempre al perito qualificato
---
## Approfondimento 2: trascrivere il corsivo italiano è un problema aperto
Non tutti gli OCR sono uguali — e nel contesto forense italiano, la differenza può essere decisiva.
**EasyOCR** (usato nell'app interattiva) usa un'architettura CNN + BiLSTM + CTC: veloce (1-3 secondi per immagine su CPU), ma con contesto linguistico limitato. Funziona bene su testo stampato e corsivo regolare.
**TrOCR** (Lab 02) è un Transformer puro: encoder visivo BEiT + decoder RoBERTa. Il contesto linguistico globale (self-attention) lo rende più accurato su corsivo complesso, ma richiede 10-20 secondi per immagine su CPU.
**dots.ocr** (Lab 08) è un Vision-Language Model da 1,7 miliardi di parametri. Il componente LLM corregge le ambiguità visive usando il contesto semantico della frase — risultato: la migliore accuratezza disponibile pubblicamente su corsivo italiano, a fronte di ~7 GB di RAM e 2-5 minuti per immagine su CPU.
La scelta dello strumento giusto dipende dal contesto: per una demo interattiva, EasyOCR. Per la trascrizione forense di un testamento olografo, dots.ocr.
---
## La demo interattiva: sei tab, tutto in un browser
L'app Gradio di GraphoLab aggrega tutte le funzionalità in un'interfaccia accessibile senza installazione (con Docker):
- **OCR Manoscritto** — carica un'immagine, ottieni il testo trascritto
- **Verifica Firma** — carica due firme, ottieni il verdetto autentica/falsa con score
- **Rilevamento Firma** — carica un documento multi-pagina, estrai automaticamente tutte le firme
- **Riconoscimento Entità** — identifica persone, luoghi, organizzazioni nel testo
- **Identificazione Scrittore** — attribuisci la paternità di un campione anonimo
- **Analisi Grafologica** — misura inclinazione, spaziatura, pressione del tratto
- **Pipeline Forense** — referto completo in un unico passaggio
- **Datazione Documenti** — carica più documenti, ottieni l'ordine cronologico per data estratta
---
## Etica e limiti: l'AI non sostituisce il perito
Questo punto merita di essere detto chiaramente.
GraphoLab è uno strumento di supporto, non un oracolo. I modelli AI producono scores e misurazioni — non verdetti. Il modello appropriato è la **collaborazione uomo-AI**: l'AI gestisce gli aspetti quantitativi e ad alta intensità di lavoro dell'analisi, mentre l'esperto si concentra sull'interpretazione, la contestualizzazione e la responsabilità legale.
In un'aula di tribunale, "il modello dice X" non è una prova. "Il perito ha utilizzato questo strumento per corroborare la propria analisi, ecco come" è un'altra storia.
La trasparenza sui limiti dei modelli — dataset di training, soglie di decisione, condizioni di validità — è parte integrante di un uso responsabile di questi strumenti in ambito forense.
---
## Provalo tu stesso
GraphoLab è completamente open source, con licenza Apache 2.0.
**Repository GitHub:** https://github.com/fabioantonini/GraphoLab
Trovi:
- Otto Jupyter notebook eseguibili (Python 3.11/3.12 + PyTorch)
- L'app Gradio avviabile in locale o via Docker
- Documentazione completa in italiano e inglese
- Script per generare dati di test sintetici
```bash
git clone https://github.com/fabioantonini/GraphoLab.git
cd GraphoLab
docker compose up gradio
# Apri http://localhost:7860
```
---
Sono curioso di sapere cosa ne pensate — in particolare chi lavora nel settore forense o legale. L'AI in questo ambito è ancora largamente inesplorata in Italia, e credo ci siano opportunità significative per chi vuole portare rigore quantitativo nel lavoro peritale.
**Grafologi, avvocati, notai, informatici forensi: cosa vi aspettate da strumenti come questo? Cosa manca ancora?**
---
*Fabio Antonini — AI Engineer & Researcher*
*GitHub: https://github.com/fabioantonini/GraphoLab*
|