Spaces:
Running
Running
| title: Project Gen AI | |
| colorFrom: yellow | |
| colorTo: blue | |
| sdk: gradio | |
| sdk_version: 6.14.0 | |
| app_file: app.py | |
| pinned: false | |
| ## Présentation du projet | |
| Ce projet consiste en la création d’un mini système **RAG (Retrieval-Augmented Generation)** capable de répondre à des questions sur l’intelligence artificielle générative à partir d’un corpus documentaire personnalisé. | |
| L’objectif pédagogique est de : | |
| - comprendre le fonctionnement d’un système RAG ; | |
| - comparer différents modèles génératifs ; | |
| - analyser les limites des modèles de langage ; | |
| - réduire les hallucinations grâce à un corpus documentaire. | |
| Le projet utilise : | |
| - un corpus thématique de 15 fichiers ; | |
| - TF-IDF pour la recherche documentaire ; | |
| - plusieurs modèles génératifs (FLAN-T5 et GPT-2) ; | |
| - une interface interactive Gradio. | |
| --- | |
| ## Fonctionnement général du système | |
| Le système fonctionne en plusieurs étapes : | |
| 1. L’utilisateur pose une question. | |
| 2. Le moteur RAG recherche les passages les plus pertinents dans le corpus. | |
| 3. Les documents récupérés sont classés selon leur pertinence. | |
| 4. Une réponse est générée ou extraite à partir du contexte trouvé. | |
| 5. Les sources utilisées sont affichées. | |
| --- | |
| ## Structure du projet | |
| ```bash | |
| Mini_chatbot_RAG/ | |
| │ | |
| ├── corpus/ | |
| │ ├── diffusion_models.txt | |
| │ ├── ethique_ia.txt | |
| │ ├── gan.txt | |
| │ ├── ia_act.txt | |
| │ ├── ia_art.txt | |
| │ ├── ia_cybersecurite.txt | |
| │ ├── ia_education.txt | |
| │ ├── ia_finance.txt | |
| │ ├── ia_medecine.txt | |
| │ ├── ia_rh.txt | |
| │ ├── llm.txt | |
| │ ├── rag.txt | |
| │ ├── rgpd_ia.txt | |
| │ ├── transformers.txt | |
| │ └── vae.txt | |
| │ | |
| ├── app.py | |
| ├── rag.py | |
| ├── app_gpt2.py | |
| ├── rag_gpt2.py | |
| ├── README.md | |
| └── venv/ | |