Spaces:

Diaure
/

Futurisys_ML_API

Runtime error

App Files Files Community

Aurélie GABU commited on Jan 2

Commit

73401e0

1 Parent(s): 77950e7

API: exposition du model ML avec les éléments nécessaires, mise en place tests API, mise à jour readme

Browse files

Files changed (8) hide show

App/main.py +16 -0
App/model/mapping_classes.json +1 -0
App/model/preprocesseur_fitted.joblib +0 -0
App/model/variables_entree.json +1 -1
App/predict.py +25 -0
App/schemas.py +0 -1
README.md +52 -2
tests/test_api.py +44 -0

App/main.py CHANGED Viewed

	@@ -0,0 +1,16 @@

+from fastapi import FastAPI
+from App.schemas import EmployeeFeatures
+from App.predict import predict_employee
+app = FastAPI(
+    title = "Futurisys ML API",
+    description = "API de prédiction du départ des employés",
+    version="0.1.0"
+)
+@app.post("/predict")
+def predict(data: EmployeeFeatures):
+    """
+    Prédit la probabilité de départ d'un employé à partir de ses caractéristiques.
+    """
+    return predict_employee(data.model_dump())

App/model/mapping_classes.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"0": "Reste", "1": "Part"}

App/model/preprocesseur_fitted.joblib ADDED Viewed

Binary file (8.04 kB). View file

App/model/variables_entree.json CHANGED Viewed

@@ -1 +1 @@

- ["genre", "statut_marital", "departement", "poste", "domaine_etude", "frequence_deplacement", "heure_supplementaires", "evolution_cat_evol", "categorie_employe", "~~exp_hors_entreprise~~", "~~annees_dans_l_entreprise~~", "ecart_note_evaluation", "~~age~~", "~~ratio_sans_promotion~~", "~~distance_domicile_travail~~", "~~revenu_mensuel~~", "~~satisfaction_employee_environnement~~", "~~revenu_par_annee_experience_totale~~", "~~nombre_experiences_precedentes~~", "~~niveau_education~~", "~~mobilite_promotion~~", "~~satisfaction_employee_nature_travail~~", "~~note_evaluation_actuelle~~", "~~annees_depuis_la_derniere_promotion~~", "~~satisfaction_employee_equilibre_pro_perso~~", "~~revenu_par_annee_experience_interne~~", "~~nombre_participation_pee~~", "~~satisfaction_globale~~", "~~satisfaction_employee_equipe~~", "~~nb_formations_suivies~~"]

+ ["genre", "statut_marital", "departement", "poste", "domaine_etude", "frequence_deplacement", "heure_supplementaires", "evolution_cat_evol", "categorie_employe", "satisfaction_employee_nature_travail", "nombre_participation_pee", "ecart_note_evaluation", "revenu_mensuel", "distance_domicile_travail", "satisfaction_globale", "niveau_education", "note_evaluation_actuelle", "satisfaction_employee_equipe", "age", "revenu_par_annee_experience_interne", "satisfaction_employee_equilibre_pro_perso", "nombre_experiences_precedentes", "annees_dans_l_entreprise", "nb_formations_suivies", "revenu_par_annee_experience_totale", "ratio_sans_promotion", "satisfaction_employee_environnement", "exp_hors_entreprise", "mobilite_promotion", "annees_depuis_la_derniere_promotion"]

App/predict.py CHANGED Viewed

	@@ -0,0 +1,25 @@

+import joblib
+import pandas as pd
+from App.schemas import EmployeeFeatures
+import json
+model = joblib.load("App/model/modele_final_xgb.joblib")
+FEATURES = list(EmployeeFeatures.model_fields.keys())
+with open("App/model/mapping_classes.json") as f:
+    CLASS_MAPPING = json.load(f)
+def predict_employee(data: dict):
+    df = pd.DataFrame([data])[FEATURES]
+    print("Colonnes API :", df.columns.tolist())
+    print("Nombre colonnes API :", len(df.columns))
+    pred = model.predict(df)[0]
+    proba = model.predict_proba(df)[0][1]
+    return {
+        "Prediction": CLASS_MAPPING[str(pred)],
+        "Probabilite_depart": float(proba)
+    }

App/schemas.py CHANGED Viewed

@@ -1,5 +1,4 @@
 from pydantic import BaseModel
-from typing import Optional
 class EmployeeFeatures(BaseModel):
     genre: str

 from pydantic import BaseModel
 class EmployeeFeatures(BaseModel):
     genre: str

README.md CHANGED Viewed

@@ -18,7 +18,6 @@ versionnage, tests, base de données et automatisation.
 - Préparer une base solide pour un déploiement en production
 ## Périmètre fonctionnel
 Le projet inclut :
 - Une API développée avec **FastAPI**
@@ -40,9 +39,60 @@ le pipeline exécute automatiquement les étapes suivantes :
 L’objectif est de garantir que :
 - le projet reste installable
-- les transformations et composants critiques ne régressent pas
 - toute fusion vers la branche `develop` est validée automatiquement
 ## Stack technique
 - **Langage** : Python

 - Préparer une base solide pour un déploiement en production
 ## Périmètre fonctionnel
 Le projet inclut :
 - Une API développée avec **FastAPI**
 L’objectif est de garantir que :
 - le projet reste installable
+- les transformations et composants (chargement du modèle, prédiction) ne régressent pas
 - toute fusion vers la branche `develop` est validée automatiquement
+## Architecture de l’API
+L’API est développée avec **FastAPI** et repose sur :
+- un schéma d’entrée validé avec **Pydantic**
+- un préprocesseur entraîné et sauvegardé
+- un modèle de machine learning sérialisé avec **joblib**
+Les artefacts du modèle sont stockés dans le dossier `App/model/` :
+- `preprocesseur_fitted.joblib`
+- `model_final_xgb.joblib`
+- `mapping_classes.json`
+## Lancer l’API en local
+Depuis la racine du projet :
+```bash
+uvicorn App.main:app --reload --log-level debug
+```
+L’API est alors accessible à l’adresse  http://127.0.0.1:8000/
+La documentation interactive à http://127.0.0.1:8000/docs
+### Endpoint principal
+`POST /predict`
+Cet endpoint reçoit les caractéristiques d’un employé et retourne :
+- une prédiction lisible ("Reste" ou "Part")
+- la probabilité associée au départ
+Exemple de réponse :
+```json
+{
+  "prediction": "Part",
+  "probabilite_depart": 0.79
+}
+```
+Les données d’entrée sont validées automatiquement avant l’appel au modèle,
+garantissant la cohérence avec les variables utilisées lors de l’entraînement.
+## Documentation des endpoints
+L’API expose un endpoint principal de prédiction.
+**POST /predict**
+  - Description : retourne une prédiction de départ d’un employé
+  - Validation des données : Pydantic
+  - Réponses possibles :
+    - 200 : prédiction valide
+    - 422 : données invalides
 ## Stack technique
 - **Langage** : Python

tests/test_api.py ADDED Viewed

	@@ -0,0 +1,44 @@

+from fastapi.testclient import TestClient
+from App.main import app
+client = TestClient(app)
+def test_predict_endpoint():
+emp_caract = {
+  "genre": "M",
+  "statut_marital": "Marié(e)",
+  "departement": "Commercial",
+  "poste": "Cadre Commercial",
+  "domaine_etude": "Infra & Cloud",
+  "frequence_deplacement": "Occasionnel",
+  "heure_supplementaires": "false",
+  "evolution_cat_evol": "hausse",
+  "categorie_employe": "employe-experimente",
+  "satisfaction_employee_nature_travail": 3,
+  "nombre_participation_pee": 0,
+  "ecart_note_evaluation": 1,
+  "revenu_mensuel": 10609,
+  "distance_domicile_travail": 1,
+  "satisfaction_globale": 2.00,
+  "niveau_education": 2,
+  "note_evaluation_actuelle": 3,
+  "satisfaction_employee_equipe": 3,
+  "age": 37,
+  "revenu_par_annee_experience_interne": 9093,
+  "satisfaction_employee_equilibre_pro_perso": 1,
+  "nombre_experiences_precedentes": 5,
+  "annees_dans_l_entreprise": 14,
+  "nb_formations_suivies": 2,
+  "revenu_par_annee_experience_totale": 7488,
+  "ratio_sans_promotion": 0,
+  "satisfaction_employee_environnement": 1,
+  "exp_hors_entreprise": 3,
+  "mobilite_promotion": -10,
+  "annees_depuis_la_derniere_promotion": 11}
+response = client.post("/predict", json = emp_caract)
+assert response.status_code == 200
+assert "prediction" in response.json()
+assert "probabilite_depart" in response.json()