Spaces:

ericjedha
/

getaroundapi

Sleeping

App Files Files Community

ericjedha commited on Aug 16, 2025

Commit

4e0eb62

verified ·

1 Parent(s): 2776de6

Update app.py

Browse files

Files changed (1) hide show

app.py +64 -38

app.py CHANGED Viewed

@@ -4,24 +4,63 @@ import mlflow
 import mlflow.pyfunc
 import logging
 import os
-from typing import Literal, List, Union
-from fastapi import FastAPI, HTTPException, File, UploadFile
-from pydantic import BaseModel
 from contextlib import asynccontextmanager
-import joblib
-import traceback
-# --- Configuration ---
-app = FastAPI()
-# Configuration des logs
 logging.basicConfig(level=logging.INFO)
 logger = logging.getLogger(__name__)
-# --- Modèle de données Pydantic pour la requête ---
 class Item(BaseModel):
     model_key: str
     mileage: int
@@ -37,36 +76,29 @@ class Item(BaseModel):
     has_speed_regulator: int
     winter_tires: int
-# --- Endpoint de prédiction ---
 @app.post("/predict/")
 async def predict(item: Item):
     try:
         # Créer un DataFrame à partir des données de la requête
-        # La méthode `model_dump()` de Pydantic est plus sûre que de reconstruire le dict à la main
         car_df = pd.DataFrame([item.model_dump()])
-        os.environ["APP_URI"] = "https://ericjedha-getaroundml.hf.space"
-        EXPERIMENT_NAME = "08_GETAROUND"
-        # Set experiment's info
-        mlflow.set_experiment(EXPERIMENT_NAME)
-        # Get our experiment info
-        experiment = mlflow.get_experiment_by_name(EXPERIMENT_NAME)
-        # Charger le modèle depuis mlflow
-        logged_model = 'runs:/8d6657ebb69943f298f1124df0db622f/xgboost_ridge_pipeline'
         logger.info(f"Données reçues pour la prédiction : \n{car_df.to_string()}")
-        loaded_model = mlflow.pyfunc.load_model(logged_model)
-        # Utiliser le modèle déjà en mémoire pour faire la prédiction
-        prediction = loaded_model.predict(car_df)
         # Formater la réponse
-        # `.tolist()[0]` est une bonne pratique pour extraire la première valeur d'un array numpy
         response = {"prediction": prediction.tolist()[0]}
         logger.info(f"Prédiction effectuée : {response}")
@@ -74,11 +106,5 @@ async def predict(item: Item):
     except Exception as e:
         logger.error(f"Erreur lors de la prédiction : {e}")
-        # Il est utile de logguer l'erreur complète pour le débogage
-        import traceback
         logger.error(traceback.format_exc())
-        raise HTTPException(status_code=500, detail=f"Erreur serveur lors de la prédiction : {str(e)}")
-@app.get("/")
-def read_root():
-    return {"message": "Bienvenue sur l'API de prédiction GetAround"}

 import mlflow.pyfunc
 import logging
 import os
+import traceback
 from contextlib import asynccontextmanager
+from fastapi import FastAPI, HTTPException
+from pydantic import BaseModel
+# --- Configuration des logs ---
 logging.basicConfig(level=logging.INFO)
 logger = logging.getLogger(__name__)
+# --- Dictionnaire pour stocker les modèles chargés ---
+# On le remplit au démarrage de l'application
+ml_models = {}
+# --- Configuration du Lifespan de l'application ---
+@asynccontextmanager
+async def lifespan(app: FastAPI):
+    # Code exécuté au démarrage de l'application
+    logger.info("Démarrage de l'application: chargement du modèle...")
+    # 1. Configurer l'URI du serveur MLflow (LA PARTIE LA PLUS IMPORTANTE)
+    #    Cette variable doit être définie dans les "Secrets" de votre Space FastAPI
+    MLFLOW_TRACKING_URI = os.getenv("MLFLOW_TRACKING_URI")
+    if not MLFLOW_TRACKING_URI:
+        raise ValueError("La variable d'environnement MLFLOW_TRACKING_URI n'est pas définie !")
+    mlflow.set_tracking_uri(MLFLOW_TRACKING_URI)
+    logger.info(f"MLflow tracking URI configuré sur: {MLFLOW_TRACKING_URI}")
+    # 2. Configurer l'authentification si votre Space MLflow est privé
+    #    Le token doit aussi être dans les "Secrets" du Space FastAPI
+    HF_TOKEN = os.getenv("HF_TOKEN")
+    if HF_TOKEN:
+        os.environ['MLFLOW_TRACKING_USERNAME'] = "ericjedha" # ou tout autre nom d'utilisateur
+        os.environ['MLFLOW_TRACKING_PASSWORD'] = HF_TOKEN
+        logger.info("Authentification MLflow configurée avec un token.")
+    # 3. Charger le modèle
+    try:
+        logged_model_uri = 'runs:/8d6657ebb69943f298f1124df0db622f/xgboost_ridge_pipeline'
+        # Charger le modèle et le stocker dans notre dictionnaire
+        ml_models["getaround_model"] = mlflow.pyfunc.load_model(logged_model_uri)
+        logger.info("Modèle chargé avec succès et prêt à être utilisé.")
+    except Exception as e:
+        logger.error(f"Erreur critique lors du chargement du modèle: {e}")
+        logger.error(traceback.format_exc())
+        # Si le modèle ne se charge pas, l'application ne peut pas fonctionner.
+        # On pourrait choisir d'arrêter l'application ici, mais pour l'instant on logue l'erreur.
+    yield
+    # Code exécuté à l'arrêt de l'application (cleanup)
+    logger.info("Arrêt de l'application: nettoyage...")
+    ml_models.clear()
+# --- Initialisation de l'application FastAPI avec le lifespan ---
+app = FastAPI(lifespan=lifespan)
+# --- Modèle de données Pydantic pour la requête ---
 class Item(BaseModel):
     model_key: str
     mileage: int
     has_speed_regulator: int
     winter_tires: int
+# --- Endpoints ---
+@app.get("/")
+def read_root():
+    return {"message": "Bienvenue sur l'API de prédiction GetAround"}
 @app.post("/predict/")
 async def predict(item: Item):
+    # Vérifier si le modèle est bien chargé
+    if "getaround_model" not in ml_models:
+        raise HTTPException(
+            status_code=503,
+            detail="Le modèle n'est pas disponible. L'application n'a pas pu le charger au démarrage."
+        )
     try:
         # Créer un DataFrame à partir des données de la requête
         car_df = pd.DataFrame([item.model_dump()])
         logger.info(f"Données reçues pour la prédiction : \n{car_df.to_string()}")
+        # Utiliser le modèle DÉJÀ en mémoire pour faire la prédiction
+        prediction = ml_models["getaround_model"].predict(car_df)
         # Formater la réponse
         response = {"prediction": prediction.tolist()[0]}
         logger.info(f"Prédiction effectuée : {response}")
     except Exception as e:
         logger.error(f"Erreur lors de la prédiction : {e}")
         logger.error(traceback.format_exc())
+        raise HTTPException(status_code=500, detail=f"Erreur serveur lors de la prédiction : {str(e)}")