MEscriva
/

gilbert-pyannote-diarization

@@ -10,13 +10,18 @@ library_name: pyannote
 pipeline_tag: audio-classification
 ---
-# Gilbert - Modèle pyannote Diarisation
-Modèle de diarisation de locuteurs basé sur pyannote.audio pour le projet Gilbert.
 ## Description
-Ce modèle utilise pyannote.audio pour la diarisation de locuteurs (identification et segmentation des locuteurs dans un audio).
 ## Modèles supportés
@@ -46,7 +51,20 @@ for turn, _, speaker in diarization.itertracks(yield_label=True):
     print(f"Speaker {speaker}: {turn.start:.2f}s - {turn.end:.2f}s")
 ```
-### Avec le script fourni
 ```bash
 python diarization_pyannote_demo.py audio.wav --model pyannote/speaker-diarization-3.1
@@ -64,6 +82,12 @@ python diarization_pyannote_demo.py audio.wav --model pyannote/speaker-diarizati
 Le modèle génère des fichiers au format :
 - **RTTM** : Format standard Rich Transcription Time Marked
 - **JSON** : Segments avec `{"speaker": "SPEAKER_00", "start": 0.0, "end": 3.25}`
 ## Performance

 pipeline_tag: audio-classification
 ---
+# Gilbert - Modèle pyannote Diarisation (Version Propriétaire)
+Modèle de diarisation de locuteurs basé sur pyannote.audio, **version personnalisée et optimisée pour le projet Gilbert**.
 ## Description
+Ce modèle utilise pyannote.audio avec des améliorations propriétaires pour la diarisation de locuteurs :
+- ✅ **Post-traitement intelligent** : Fusion des segments courts et optimisation pour les réunions
+- ✅ **Détection d'overlap améliorée** : Identification précise des chevauchements entre locuteurs
+- ✅ **Statistiques avancées** : Métriques détaillées par locuteur (durée, segments, overlaps)
+- ✅ **Configuration optimisée** : Paramètres ajustés spécifiquement pour les réunions
+- ✅ **Version Gilbert v1.0** : Version propriétaire avec marqueurs et améliorations uniques
 ## Modèles supportés
     print(f"Speaker {speaker}: {turn.start:.2f}s - {turn.end:.2f}s")
 ```
+### Avec le script Gilbert (recommandé - version propriétaire)
+```bash
+python diarization_pyannote_gilbert.py audio.wav --model pyannote/speaker-diarization-3.1
+```
+**Avantages de la version Gilbert :**
+- Post-traitement intelligent des segments
+- Fusion automatique des segments courts
+- Détection d'overlaps améliorée
+- Statistiques avancées par locuteur
+- Optimisé pour les réunions
+### Avec le script standard
 ```bash
 python diarization_pyannote_demo.py audio.wav --model pyannote/speaker-diarization-3.1
 Le modèle génère des fichiers au format :
 - **RTTM** : Format standard Rich Transcription Time Marked
 - **JSON** : Segments avec `{"speaker": "SPEAKER_00", "start": 0.0, "end": 3.25}`
+- **Stats JSON** (version Gilbert uniquement) : Statistiques avancées avec overlaps et métriques par locuteur
+### Paramètres spécifiques à la version Gilbert
+- `--min-segment` : Durée minimale des segments (défaut: 0.5s)
+- `--merge-gaps` : Gaps à fusionner entre segments du même locuteur (défaut: 0.3s)
 ## Performance