Spaces:

ASI-Engineer
/

oc_p5-dev

Sleeping

App Files Files Community

oc_p5-dev / docs /pipeline.md

ASI-Engineer

Upload folder using huggingface_hub

572fd8e verified 4 months ago

preview code

raw

history blame

2.42 kB

Plan du Pipeline CI/CD

Objectif

Automatiser tests (qualité code/ML) et déploiement vers Hugging Face Spaces pour un POC scalable. Flux : Push → Tests → Build → Deploy (dev sur branche dev, prod sur main avec validation manuelle).
Choix : GitHub Actions pour simplicité/intégration gratuite ; HF Spaces pour hébergement ML sans infra (GPU si besoin pour inférence). Temps cible <10min par run (vigilance doc).

Triggers

Push sur branches : dev (auto-deploy dev), main (deploy prod après review).
Pull Requests vers main (tests + validation avant merge).
Choix : Limite à ces branches pour isoler envs ; évite triggers sur features pour perf.

Étapes du Pipeline (Séquentiel : Tests d'abord, puis Deploy si OK)

Checkout Code : Récupère le repo.
Outil : actions/checkout@v4 (standard, rapide).
Setup Environnement : Python 3.10+ (compatible FastAPI/Pytest/SQLAlchemy).
Choix : Version fixe pour reproductibilité ML ; cache deps pour accélérer runs futurs.
Installation Dépendances : pip install -r requirements.txt + outils tests (pytest, black, flake8).
Choix : Inclut lint pour standards code (reco ML : black pour formatage auto).
Linting : Vérifie style (black --check, flake8).
Pourquoi ? Détecte erreurs tôt ; coverage >80% visé pour robustesse.
Tests Automatisés : pytest --cov=src (unitaires/fonctionnels API/ML).
Choix : Couvre cas critiques (erreurs validation Pydantic, prédictions ML) ; rapport XML pour badges GitHub.
Build (Optionnel pour POC) : Package API (e.g., build Docker si HF le requiert).
Évolutif : Ajoute plus tard pour prod.
Déploiement : Push vers HF Space (dev/prod).
Choix : Conditionnel par branche ; utilise secrets pour HF_TOKEN (sécurité).

Gestion Envs et Secrets

Devs : Branche dev → Space ASI-Engineer/oc_p5 (tests rapides).
Test/Prod : PR → main → Space espace-prod (review requise).
Secrets : HF_TOKEN (GitHub Secrets) ; jamais en code.
Choix : Sépare envs pour traçabilité (inputs/outputs ML en DB PostgreSQL plus tard).

Standards Code/ML

Format : Black.
Tests : >80% coverage ; reproductibles (seeds pour ML).
Monitoring : Badges GitHub pour coverage/status.
Pourquoi ? Assure fiabilité en prod ; aligné sur reco OpenClassrooms (ressource doc).