| # DistilBERT Query Classifier | |
| Modèle de classification binaire pour distinguer les requêtes RAG des demandes d'envoi de messages. | |
| ## Utilisation | |
| ```python | |
| from transformers import pipeline | |
| # Charger le modèle | |
| classifier = pipeline("text-classification", model="your-username/distilbert-query-classifier") | |
| # Classifier une requête | |
| result = classifier("What are the prerequisites for the machine learning course?") | |
| print(result) | |
| # [{'label': 'question_rag', 'score': 0.92}] | |
| ``` | |
| ## Classes | |
| - **question_rag** (0): Questions nécessitant une recherche RAG | |
| - **send_message** (1): Demandes d'envoi de messages | |
| ## Exemples | |
| ```python | |
| queries = [ | |
| "What topics are covered in the Python course?", # → question_rag | |
| "Send a message to John about the meeting", # → send_message | |
| ] | |
| results = classifier(queries) | |
| ``` | |
| ## Détails techniques | |
| - **Modèle**: distilbert-base-uncased | |
| - **Dataset**: 98 exemples (50/50 split) | |
| - **Accuracy**: 93% sur test set | |
| - **Couches entraînées**: 2 dernières couches + classifier | |
| - **Epochs**: 10 | |
| ## Limitations | |
| - Petit dataset d'entraînement (98 exemples) | |
| - Anglais uniquement | |
| - Classification binaire seulement | |