Spaces:
Running
Running
A newer version of the Gradio SDK is available: 6.19.0
metadata
title: Project Gen AI
colorFrom: yellow
colorTo: blue
sdk: gradio
sdk_version: 6.14.0
app_file: app.py
pinned: false
Présentation du projet
Ce projet consiste en la création d’un mini système RAG (Retrieval-Augmented Generation) capable de répondre à des questions sur l’intelligence artificielle générative à partir d’un corpus documentaire personnalisé.
L’objectif pédagogique est de :
- comprendre le fonctionnement d’un système RAG ;
- comparer différents modèles génératifs ;
- analyser les limites des modèles de langage ;
- réduire les hallucinations grâce à un corpus documentaire.
Le projet utilise :
- un corpus thématique de 15 fichiers ;
- TF-IDF pour la recherche documentaire ;
- plusieurs modèles génératifs (FLAN-T5 et GPT-2) ;
- une interface interactive Gradio.
Fonctionnement général du système
Le système fonctionne en plusieurs étapes :
- L’utilisateur pose une question.
- Le moteur RAG recherche les passages les plus pertinents dans le corpus.
- Les documents récupérés sont classés selon leur pertinence.
- Une réponse est générée ou extraite à partir du contexte trouvé.
- Les sources utilisées sont affichées.
Structure du projet
Mini_chatbot_RAG/
│
├── corpus/
│ ├── diffusion_models.txt
│ ├── ethique_ia.txt
│ ├── gan.txt
│ ├── ia_act.txt
│ ├── ia_art.txt
│ ├── ia_cybersecurite.txt
│ ├── ia_education.txt
│ ├── ia_finance.txt
│ ├── ia_medecine.txt
│ ├── ia_rh.txt
│ ├── llm.txt
│ ├── rag.txt
│ ├── rgpd_ia.txt
│ ├── transformers.txt
│ └── vae.txt
│
├── app.py
├── rag.py
├── app_gpt2.py
├── rag_gpt2.py
├── README.md
└── venv/