feedbacks-scoring / QUICKSTART.md
Matis Codjia
Scoring app
1d8c2e0
# Guide de Démarrage Rapide
Configuration en 5 minutes pour déployer l'application d'annotation sécurisée.
## Prérequis
- Un compte HuggingFace
- Accès à votre Space `matis35/feedbacks-scoring-app`
- Le dataset à annoter (format JSONL ou sur HF Hub)
## Étape 1 : Créer le Dataset de Stockage (2 min)
1. Allez sur https://huggingface.co/new-dataset
2. Nom : `ffgen-annotations-storage`
3. Visibilité : **Private** (très important!)
4. Cliquez sur "Create dataset"
5. Laissez-le vide, ne chargez rien
✅ Vous avez maintenant : `matis35/ffgen-annotations-storage`
## Étape 2 : Créer un Token HF (1 min)
1. Allez sur https://huggingface.co/settings/tokens
2. Cliquez "New token"
3. Nom : `annotation-app-write`
4. Type : **Write** (important!)
5. Cliquez "Generate token"
6. **Copiez le token** (format `hf_xxxxxxxxxxxx`)
⚠️ Gardez ce token en sécurité, ne le partagez pas!
## Étape 3 : Configurer les Secrets (2 min)
1. Allez sur votre Space : https://huggingface.co/spaces/matis35/feedbacks-scoring-app
2. Cliquez sur **Settings** (en haut)
3. Scrollez vers "Variables and secrets"
4. Ajoutez ces 3 secrets :
### Secret 1 : APP_PASSWORD
- Nom : `APP_PASSWORD`
- Valeur : Choisissez un mot de passe fort (ex: `Annotator2025!`)
- Type : Secret
### Secret 2 : HF_TOKEN
- Nom : `HF_TOKEN`
- Valeur : Le token copié à l'étape 2 (`hf_xxxxx`)
- Type : Secret
### Secret 3 : HF_DATASET_REPO
- Nom : `HF_DATASET_REPO`
- Valeur : `matis35/ffgen-annotations-storage`
- Type : Secret
✅ Les 3 secrets doivent être visibles dans la liste
## Étape 4 : Configurer les Annotateurs (2 min)
### Option A : Configuration basique (3 annotateurs)
Copiez le fichier exemple :
```bash
cd feedbacks-scoring-app
cp data/annotators.json.example data/annotators.json
```
Éditez `data/annotators.json` selon votre dataset :
```json
{
"annotator_1": {
"name": "Alice",
"start_idx": 0,
"end_idx": 100
},
"annotator_2": {
"name": "Bob",
"start_idx": 100,
"end_idx": 200
},
"annotator_3": {
"name": "Charlie",
"start_idx": 200,
"end_idx": 300
}
}
```
### Option B : Utiliser vos subsets FFGen
Si vous avez utilisé `create_annotation_study.py` :
```bash
# Vous avez créé 10 subsets avec create_annotation_study.py
# Configurez 10 annotateurs correspondants
# Exemple pour 10 annotateurs, 40 items chacun
python -c "
import json
config = {}
for i in range(10):
config[f'annotator_{i+1}'] = {
'name': f'Annotateur {i+1}',
'start_idx': i * 40,
'end_idx': (i + 1) * 40,
'description': f'Subset {i+1}/10'
}
with open('data/annotators.json', 'w') as f:
json.dump(config, f, indent=2)
print('✅ Config créée pour 10 annotateurs')
"
```
## Étape 5 : Pousser sur HF (1 min)
```bash
cd feedbacks-scoring-app
# Vérifier les changements
git status
# Commiter
git add .
git commit -m "Add secure authentication and HF persistence"
# Pousser vers HF Spaces
git push origin main
```
Le Space va rebuilder automatiquement (3-5 minutes).
## Étape 6 : Tester (2 min)
1. Attendez que le Space soit "Running" (vert)
2. Ouvrez l'app : https://huggingface.co/spaces/matis35/feedbacks-scoring-app
3. Testez la connexion :
- Entrez le mot de passe (`APP_PASSWORD`)
- Sélectionnez un annotateur
- Vérifiez que ça fonctionne
## Étape 7 : Distribuer aux Annotateurs
Envoyez ce message à vos annotateurs :
```
Bonjour,
Voici les informations pour accéder à l'outil d'annotation :
URL : https://huggingface.co/spaces/matis35/feedbacks-scoring-app
Mot de passe : [VOTRE_APP_PASSWORD]
Votre identifiant : [annotator_X]
Instructions :
1. Ouvrez l'URL et entrez le mot de passe
2. Sélectionnez votre identifiant dans la liste
3. Chargez le dataset (je vous enverrai le lien/fichier)
4. Annotez les feedbacks selon les critères ci-dessous
5. IMPORTANT : Cliquez sur "☁️ Sauvegarder sur HF" toutes les 30-60 minutes
6. Vous pouvez fermer et reprendre plus tard
Critères d'annotation :
- Score 1 : [DÉFINIR]
- Score 2 : [DÉFINIR]
- Score 3 : [DÉFINIR]
- Score 4 : [DÉFINIR]
- Score 5 : [DÉFINIR]
Questions ? Contactez-moi : [VOTRE_EMAIL]
```
## Vérification Post-Déploiement
✅ Checklist de vérification :
- [ ] Le Space démarre sans erreur
- [ ] L'authentification fonctionne
- [ ] La sélection d'annotateur fonctionne
- [ ] Le chargement de dataset fonctionne
- [ ] Le filtrage par portion fonctionne (vérifier les nombres)
- [ ] La sauvegarde HF fonctionne (vérifier dans le dataset)
- [ ] L'export JSONL fonctionne
- [ ] Les annotateurs peuvent se connecter
## Commandes Utiles
### Voir les logs du Space
```bash
# Via l'interface web : Settings > Logs
# Ou regarder en temps réel depuis l'onglet "Logs"
```
### Vérifier les annotations sauvegardées
```bash
# Allez sur : https://huggingface.co/datasets/matis35/ffgen-annotations-storage
# Vous devriez voir un dossier annotations/ avec des fichiers .json
```
### Télécharger toutes les annotations
```bash
huggingface-cli download \
matis35/ffgen-annotations-storage \
--repo-type dataset \
--local-dir ./collected_annotations
```
### Analyser l'accord inter-annotateurs (si gold items)
```bash
cd FFGen/3_data_processing
python analyze_agreement.py \
../../collected_annotations/annotations/*.json \
--gold-file annotation_study/gold_standard.json
```
## Dépannage Express
### Le Space ne démarre pas
```bash
# Vérifiez les logs
# Problème courant : secret mal configuré
# Solution : Vérifiez Settings > Variables and secrets
```
### "HF Storage not configured"
```bash
# Il manque HF_TOKEN ou HF_DATASET_REPO
# Ajoutez-les dans Settings > Secrets
```
### "Authentication failed"
```bash
# APP_PASSWORD incorrect ou manquant
# Vérifiez Settings > Secrets
```
### Un annotateur voit tout le dataset
```bash
# Problème dans annotators.json
# Vérifiez start_idx et end_idx
# Rechargez le dataset après correction
```
### Les annotations disparaissent
```bash
# Les annotateurs n'ont pas sauvegardé sur HF
# Rappelez-leur de cliquer sur "☁️ Sauvegarder sur HF"
# La sauvegarde locale est perdue tous les 48h
```
## Support
Documentation complète : [CONFIGURATION.md](CONFIGURATION.md)
Problèmes ?
- Vérifiez d'abord les logs du Space
- Consultez la section Dépannage de CONFIGURATION.md
- Ouvrez une issue GitHub si nécessaire
---
**Temps total : ~15 minutes**
Prochain fichier à lire : [CONFIGURATION.md](CONFIGURATION.md) pour les détails complets.