create API and format JSON input

Files changed (4) hide show

README.md +37 -0
app.py +24 -0
inference.py +60 -8
requirements.txt +6 -0

README.md CHANGED Viewed

@@ -5,6 +5,43 @@ L'entrainement du modèle a été fait avec Google Collab : https://colab.resear
 La documentation sur l'entraînement du modèle est la suivante : https://docs.google.com/spreadsheets/d/1oBshoNy2NJZQreOEbBfcWCCg2wo0PQDo/edit?gid=1220399676#gid=1220399676
 ## Exemple d'utilisation
 ```python
 import joblib

 La documentation sur l'entraînement du modèle est la suivante : https://docs.google.com/spreadsheets/d/1oBshoNy2NJZQreOEbBfcWCCg2wo0PQDo/edit?gid=1220399676#gid=1220399676
+# Input Data
+Les données d'entrée du modèle sont les suivantes :
+- puiss_admin_98
+- conso_urb
+- conso_exurb
+- masse_ordma_max
+- lib_mrq_BMW
+- lib_mrq_MERCEDES
+- lib_mrq_VOLKSWAGEN
+- typ_boite_nb_rapp_A 5
+- typ_boite_nb_rapp_A 6
+- champ_v9_715/2007*692/2008EURO5
+- Carrosserie_BREAK
+- Carrosserie_COUPE
+- Carrosserie_MINIBUS
+- Carrosserie_TS TERRAINS/CHEMINS
+- gamme_INFERIEURE
+- gamme_LUXE
+- gamme_MOY-INFERIEURE
+- gamme_MOY-SUPER
+- gamme_SUPERIEURE
+Pour faciliter la réception d'information, on va demander des informations plus concises puis on va recréer l'ensemble de ses champs. On s'attends à un JSON de la forme :
+{
+    "puiss_admin_98": 7,
+    "conso_urb": 5.6,
+    "conso_exurb": 4.3,
+    "masse_ordma_max": 1500,
+    "marque": "BMW",
+    "typ_boite": "A 5",
+    "champ_v9": false,
+    "carrosserie": "COUPE",
+    "gamme": "LUXE"
+}
 ## Exemple d'utilisation
 ```python
 import joblib

app.py ADDED Viewed

	@@ -0,0 +1,24 @@

+from fastapi import FastAPI
+from pydantic import BaseModel
+# Définir l'API
+app = FastAPI()
+# Définir un modèle d'entrée
+class InputData(BaseModel):
+    puiss_admin_98: int
+    conso_urb: float
+    conso_exurb: float
+    masse_ordma_max: float
+    marque: str
+    typ_boite: str
+    champ_v9 : bool
+    carrosserie: str
+    gamme: str
+# Endpoint pour prédiction
+@app.post("/predict")
+def predict(data: InputData):
+    input_json = data.dict()
+    result = preprocess_and_predict(input_json)
+    return result

inference.py CHANGED Viewed

@@ -1,14 +1,66 @@
 import joblib
-import numpy as np
-# Charger le modèle
 model = joblib.load("model.joblib")
-# Fonction de prédiction
-def predict(input_data):
     """
-    input_data : array-like ou liste de caractéristiques
-    Retourne les prédictions du modèle
     """
-    input_array = np.array(input_data).reshape(1, -1)
-    return model.predict(input_array).tolist()

+import pandas as pd
 import joblib
+# Charger le modèle scikit-learn
 model = joblib.load("model.joblib")
+def preprocess_and_predict(input_json):
     """
+    Fonction pour traiter les données JSON entrantes, calculer les champs dérivés,
+    et prédire à l'aide d'un modèle scikit-learn.
+    Args:
+        input_json (dict): Données simplifiées fournies par l'utilisateur. Exemple :
+        {
+            "puiss_admin_98": 7,
+            "conso_urb": 5.6,
+            "conso_exurb": 4.3,
+            "masse_ordma_max": 1500,
+            "marque": "BMW",
+            "typ_boite": "A 5",
+            "champ_v9": false,
+            "carrosserie": "COUPE",
+            "gamme": "LUXE"
+        }
+    Returns:
+        dict: Prédiction du modèle.
     """
+    # Mapper les catégories aux colonnes du modèle
+    marque_mapping = ["BMW", "MERCEDES", "VOLKSWAGEN"]
+    typ_boite_mapping = ["A 5", "A 6"]
+    carrosserie_mapping = ["BREAK", "COUPE", "MINIBUS", "TS TERRAINS/CHEMINS"]
+    gamme_mapping = ["INFERIEURE", "LUXE", "MOY-INFERIEURE", "MOY-SUPER", "SUPERIEURE"]
+    # Initialiser un dictionnaire pour construire les colonnes nécessaires
+    processed_data = {
+        "puiss_admin_98": input_json.get("puiss_admin_98", 0),
+        "conso_urb": input_json.get("conso_urb", 0.0),
+        "conso_exurb": input_json.get("conso_exurb", 0.0),
+        "masse_ordma_max": input_json.get("masse_ordma_max", 0.0),
+        "champ_v9": input_json.get("champ_v9", False),
+    }
+    # Variables indicatrices pour la marque
+    for marque in marque_mapping:
+        processed_data[f"lib_mrq_{marque}"] = 1 if input_json.get("marque") == marque else 0
+    # Variables indicatrices pour le type de boîte
+    for typ_boite in typ_boite_mapping:
+        processed_data[f"typ_boite_nb_rapp_{typ_boite}"] = 1 if input_json.get("typ_boite") == typ_boite else 0
+    # Variables indicatrices pour la carrosserie
+    for carrosserie in carrosserie_mapping:
+        processed_data[f"Carrosserie_{carrosserie}"] = 1 if input_json.get("carrosserie") == carrosserie else 0
+    # Variables indicatrices pour la gamme
+    for gamme in gamme_mapping:
+        processed_data[f"gamme_{gamme}"] = 1 if input_json.get("gamme") == gamme else 0
+    # Convertir en DataFrame pour correspondre au format attendu par le modèle
+    input_dataframe = pd.DataFrame([processed_data])
+    # Faire une prédiction
+    prediction = model.predict(input_dataframe)
+    return {"prediction": prediction.tolist()}

requirements.txt ADDED Viewed

	@@ -0,0 +1,6 @@

+fastapi
+uvicorn
+pandas
+numpy
+scikit-learn
+joblib