File size: 1,171 Bytes
9d47e22
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
# DistilBERT Query Classifier

Modèle de classification binaire pour distinguer les requêtes RAG des demandes d'envoi de messages.

## Utilisation

```python
from transformers import pipeline

# Charger le modèle
classifier = pipeline("text-classification", model="your-username/distilbert-query-classifier")

# Classifier une requête
result = classifier("What are the prerequisites for the machine learning course?")
print(result)
# [{'label': 'question_rag', 'score': 0.92}]
```

## Classes

- **question_rag** (0): Questions nécessitant une recherche RAG
- **send_message** (1): Demandes d'envoi de messages

## Exemples

```python
queries = [
    "What topics are covered in the Python course?",  # → question_rag
    "Send a message to John about the meeting",       # → send_message
]

results = classifier(queries)
```

## Détails techniques

- **Modèle**: distilbert-base-uncased
- **Dataset**: 98 exemples (50/50 split)
- **Accuracy**: 93% sur test set
- **Couches entraînées**: 2 dernières couches + classifier
- **Epochs**: 10

## Limitations

- Petit dataset d'entraînement (98 exemples)
- Anglais uniquement
- Classification binaire seulement