Spaces:
Runtime error
Runtime error
| from dash import dcc | |
| import dash_bootstrap_components as dbc | |
| def get_project_description() -> str: | |
| return """ | |
| # MooreFRCollection | |
| **MooreFRCollection** est un projet open source visant à construire un corpus bilingue **Mooré-Français** pour soutenir la recherche et le développement de technologies linguistiques adaptées au contexte burkinabé. | |
| L'objectif principal est de fournir des données essentielles pour entraîner, tester et affiner des modèles de traduction et d'autres outils d'intelligence artificielle (IA) en lien avec la langue **Mooré**, une des langues nationales du Burkina Faso. | |
| """ | |
| def get_audio_section() -> str: | |
| return """ | |
| ## **Construction de la version audio** | |
| Actuellement, nous nous concentrons sur la **partie audio** du projet. Cette phase implique la collecte, le traitement et l'alignement des segments audio et textuels pour produire un corpus riche et diversifié. | |
| Les données audio sont collectées à partir de : | |
| 1. **Textes bibliques de JW.ORG** : | |
| Les contenus ont été extraits efficacement grâce à l'outil [jwsoup](https://pypi.org/project/jwsoup/). Les segments textuels et leurs correspondances audio sont alignés pour fournir une ressource précieuse pour le traitement automatique des langues. | |
| 2. **Alignement et segmentation audio** : | |
| Les fichiers audio sont traités et segmentés en unités exploitables, accompagnées de transcriptions bilingues (Mooré-Français). Chaque segment est soigneusement vérifié pour garantir sa qualité et son utilité dans des applications variées. | |
| """ | |
| def get_applications_section() -> str: | |
| return """ | |
| ## **Applications** | |
| Le corpus **MooreFRCollection** ouvre la voie à une multitude d'applications : | |
| 1. 🔤 **Traduction automatique** | |
| Développement et évaluation de systèmes de traduction automatiques, permettant la conversion fluide du Mooré vers le Français et inversement. | |
| 2. 🧠 **Recherche linguistique** | |
| Analyse approfondie des structures syntaxiques, lexicales et phonétiques spécifiques au Mooré, pour enrichir les études linguistiques. | |
| 3. 📊 **Apprentissage supervisé** | |
| Entraînement de modèles d'apprentissage machine sur des tâches variées, comme la reconnaissance vocale ou l'analyse sentimentale en Mooré. | |
| 4. 📚 **Applications éducatives** | |
| Soutien aux enseignants, étudiants, et locuteurs natifs pour explorer les interactions linguistiques entre le Mooré et le Français. | |
| """ | |
| def get_contribution_section() -> str: | |
| return """ | |
| ## **Appel à contributions** | |
| Nous invitons toute personne intéressée à contribuer au développement de **MooreFRCollections**. Votre aide peut prendre plusieurs formes : | |
| - **Partager des données** : Soumettez des textes ou fichiers audio en Mooré, ou des données bilingues Mooré-Français. | |
| - **Participer à l'annotation** : Aidez-nous à valider et enrichir les transcriptions et traductions existantes. | |
| - **Suggérer des idées** : Proposez de nouvelles approches pour la collecte, le traitement ou les usages potentiels du corpus. | |
| """ | |
| def get_huggingface_section() -> str: | |
| return """ | |
| ### **Contribuer via HuggingFace** | |
| Pour apporter vos contributions directement au dépôt du projet sur HuggingFace, suivez ces étapes simples : | |
| 1. **Configurer votre environnement Git** : | |
| - Lisez le [guide sur la dépréciation des mots de passe Git](https://huggingface.co/blog/password-git-deprecation). | |
| - Configurez [Git SSH](https://huggingface.co/docs/hub/security-git-ssh) pour des connexions sécurisées. | |
| 2. **Changer l'URL distante** pour utiliser le dépôt HuggingFace : | |
| ```bash | |
| git remote set-url origin git@hf.co:datasets/sawadogosalif/MooreFRCollections/ | |
| ``` | |
| 3. **Créer une nouvelle branche** pour vos contributions : | |
| ```bash | |
| git checkout -b nom-de-votre-branche | |
| ``` | |
| 4. **Soumettre vos modifications** : | |
| Faites un push de vos changements et créez une demande de fusion pour qu'elle soit examinée. | |
| Nous vous encourageons également à demander l'accès à la branche de développement pour collaborer plus directement sur les améliorations. | |
| """ | |
| def create_content() -> str: | |
| sections = [ | |
| get_project_description(), | |
| "---", | |
| get_audio_section(), | |
| "---", | |
| get_applications_section(), | |
| "---", | |
| get_contribution_section(), | |
| "---", | |
| get_huggingface_section(), | |
| "---" | |
| ] | |
| return "\n".join(sections) | |
| layout= dbc.Container([ | |
| dcc.Markdown(create_content()) | |
| ]) |