Gilbert-AI
/

gilbert-fr-source

 - multilingual
 - research
 - gilbert
+---
+# Gilbert-FR-Source
+`Gilbert-FR-Source` est un modèle de transcription automatique de la parole (ASR) en langue française, utilisé comme modèle de base (backbone) pour les travaux de recherche et développement menés autour de la plateforme Gilbert. Il sert de fondation pour l’exploration de nouvelles variantes spécialisées, notamment pour les environnements professionnels, les réunions multi-locuteurs, la parole spontanée, les accents régionaux et la téléphonie large bande ou bas débit.
+L’objectif principal de ce modèle est de fournir une base stable, performante et reproductible pour l’ensemble des expérimentations subséquentes (fine-tuning, adaptation domaine, optimisation des performances et de la latence).
+---
+## 1. Objectif et utilisation
+`Gilbert-FR-Source` constitue le modèle de référence utilisé en interne pour :
+- l’évaluation comparative de pipelines ASR ;
+- les études d’adaptation domaine en conditions réelles (réunions, visios, environnements bruités) ;
+- les travaux de robustification de la transcription sur des accents ou profils vocaux diversifiés ;
+- la préparation de variantes optimisées (long-form, accents, téléphonie) ;
+- la mise en place de benchmarks et d’outils de mesure de performance interne.
+Ce modèle n’est pas une version fine-tunée, mais une base de recherche préparée pour la création de futures versions spécialisées.
+---
+## 2. Performances de référence (benchmarks publics)
+Les résultats suivants constituent des performances observées sur des jeux de données publics fréquemment utilisés dans l'évaluation des systèmes ASR :
+| Jeu de données | WER |
+|----------------|-----|
+| MLS (FR) | 3.98 % |
+| Common Voice FR (v13.0) | 7.28 % |
+| VoxPopuli (FR) | 8.91 % |
+| Fleurs (FR) | 4.84 % |
+| African Accented French | 4.20 % |
+Ces valeurs servent uniquement de référence et constituent un point de départ pour les futures variantes optimisées du modèle (long-form, accents, téléphonie). Elles permettent de situer les performances sur de la lecture, de la parole semi-libre, de la parole politique ou institutionnelle, et des accents variés.
+---
+## 3. Architecture
+Le modèle repose sur l’architecture Whisper Large V3.
+Caractéristiques principales :
+- modèle encodeur-décodeur multilingue ;
+- capacité à modéliser des séquences longues ;
+- pré-entraînement sur de larges corpus multilingues ;
+- forte spécialisation implicite en français observée dans les benchmarks publics ;
+- compatibilité avec les runtimes optimisés (CTranslate2, ONNX Runtime, MLX).
+Le modèle est particulièrement adapté aux tâches de transcription longue, multilingue et à fort besoin de stabilité syntaxique.
+---
+## 4. Données et entraînement
+Ce modèle n’a pas été réentraîné dans cette version : il est utilisé tel que, comme base de recherche.
+Les futures versions spécialiséées pourront inclure :
+- du fine-tuning sur des corpus internes de réunions professionnelles ;
+- de l’adaptation domaine pour des contextes spécifiques (enseignement supérieur, santé, administration, finance) ;
+- de la robustification sur conditions difficiles (téléphonie 8 kHz, micros dégradés, bruit ambiant) ;
+- de l’amélioration spécifique sur les accents variés.
+---
+## 5. Usages recommandés
+- transcription française standard ;
+- comparaison de pipelines ASR ;
+- prototypage et recherche ;
+- mesure de qualité et mise en place de benchmarks internes ;
+- base pour l’adaptation domaine.
+---
+## 6. Licence et conformité
+Ce dépôt contient des fichiers publiés sous licence MIT.
+Conformément à la licence MIT :
+> Une copie de la licence est fournie dans ce dépôt.
+> Certains fichiers inclus ont été initialement publiés sous licence MIT.
+Toutes les futures versions fine-tunées ou adaptées seront la propriété de Lexia France.
+---
+## 7. Versions futures prévues
+- Gilbert-FR-Longform-v1 (parole longue, réunions et discours)
+- Gilbert-FR-Accents-v1 (accents régionaux et internationaux)
+- Gilbert-FR-Téléphone-v1 (8 kHz, call center, voix compressée)
+- Gilbert-Multilingue-v1 (extension multi-langue)
+Ces versions feront l’objet d’évaluations systématiques sur les jeux de données publics et internes.
+---
+## 8. Contact
+Pour toute question, collaboration ou demande d’évaluation :
+- Site : https://gilbert-assistant.fr
+- Contact : mathis@lexiapro.fr