Spaces:

daniel-saed
/

futbol-corners-forecast-api

Running

App Files Files Community

daniel-saed commited on Nov 21, 2025

Commit

4a1cf98

verified ·

1 Parent(s): 638d8c6

Upload 2 files

Browse files

Files changed (2) hide show

src/api/api.py +190 -189
src/api/load.py +77 -65

src/api/api.py CHANGED Viewed

@@ -1,190 +1,191 @@
-# ===========================
-# SISTEMA DE PREDICCIÓN DE CORNERS - OPTIMIZADO PARA APUESTAS (VERSIÓN COMPLETA)
-# ===========================
-import numpy as np
-import pandas as pd
-import os
-from fastapi.responses import JSONResponse
-from fastapi import Depends, FastAPI, HTTPException
-from fastapi.security.api_key import APIKeyHeader
-from fastapi import Security
-from fastapi.responses import JSONResponse
-from dotenv import load_dotenv
-from src.api.load import USE_MODEL
-load_dotenv()
-model = USE_MODEL()
-app = FastAPI()
-# ===========================
-# CONFIGURACIÓN API KEY
-# ===========================
-API_KEY = os.getenv("API_KEY")  # ⚠️ CÁMBIALA POR UNA SEGURA
-api_key_header = APIKeyHeader(name="X-API-Key", auto_error=False)
-async def get_api_key(api_key: str = Security(api_key_header)):
-    """Validar API Key"""
-    if api_key != API_KEY:
-        raise HTTPException(
-            status_code=401,
-            detail="API Key inválida o faltante"
-        )
-    return api_key
-# ===========================
-# HELPER: CONVERTIR NUMPY/PANDAS A TIPOS NATIVOS
-# ===========================
-def convert_to_native(val):
-    """Convierte tipos NumPy/Pandas a tipos nativos de Python"""
-    if isinstance(val, (np.integer, np.int64, np.int32, np.int16, np.int8)):
-        return int(val)
-    elif isinstance(val, (np.floating, np.float64, np.float32, np.float16)):
-        return float(val)
-    elif isinstance(val, np.ndarray):
-        return [convert_to_native(item) for item in val.tolist()]
-    elif isinstance(val, dict):
-        return {key: convert_to_native(value) for key, value in val.items()}
-    elif isinstance(val, (list, tuple)):
-        return [convert_to_native(item) for item in val]
-    elif isinstance(val, pd.Series):
-        return convert_to_native(val.to_dict())
-    elif isinstance(val, pd.DataFrame):
-        return convert_to_native(val.to_dict(orient='records'))
-    elif pd.isna(val):
-        return None
-    else:
-        return val
-# ===========================
-# ENDPOINTS
-# ===========================
-@app.get("/")
-def read_root():
-    """Endpoint raíz con información de la API"""
-    return {
-        "api": "Corners Prediction API",
-        "version": "1.0.0",
-        "status": "active",
-        "endpoints": {
-            "/": "Información de la API",
-            "/items/": "Predicción de corners (requiere API Key)",
-            "/health": "Estado de salud"
-        },
-        "auth": "Requiere header: X-API-Key"
-    }
-@app.get("/items/")
-def predict_corners(
-    local: str,
-    visitante: str,
-    jornada: int,
-    league_code: str,
-    temporada: str = "2526",
-    api_key: str = Depends(get_api_key)  # ✅ PROTEGIDO
-):
-    """
-    Predecir corners para un partido de fútbol
-    Args:
-        local: Nombre del equipo local (requerido)
-        visitante: Nombre del equipo visitante (requerido)
-        jornada: Número de jornada (requerido, min: 1)
-        league_code: Código de liga (requerido: ESP, GER, FRA, ITA, ENG, NED, POR, BEL)
-        temporada: Temporada en formato AABB (default: "2526")
-    Returns:
-        JSON con predicción y análisis completo
-    Example:
-        GET /items/?local=Barcelona&visitante=Real%20Madrid&jornada=15&league_code=ESP&temporada=2526
-        Headers: X-API-Key: tu-clave-secreta-aqui
-    """
-    # ===========================
-    # VALIDACIONES
-    # ===========================
-    # Validar campos obligatorios
-    if not local or not visitante:
-        raise HTTPException(
-            status_code=400,
-            detail="Los parámetros 'local' y 'visitante' son obligatorios"
-        )
-    # Validar jornada
-    if jornada < 1:
-        raise HTTPException(
-            status_code=400,
-            detail="La jornada debe ser mayor o igual a 1"
-        )
-    # Validar liga
-    valid_leagues = ["ESP", "GER", "FRA", "ITA", "ENG", "NED", "POR", "BEL"]
-    if league_code not in valid_leagues:
-        raise HTTPException(
-            status_code=400,
-            detail=f"Liga inválida. Ligas válidas: {', '.join(valid_leagues)}"
-        )
-    # ===========================
-    # PREDICCIÓN
-    # ===========================
-    try:
-        resultado = model.consume_model_single(
-            local=local,
-            visitante=visitante,
-            jornada=jornada,
-            temporada=temporada,
-            league_code=league_code
-        )
-        # Verificar si hubo error en la predicción
-        if resultado.get("error"):
-            raise HTTPException(
-                status_code=422,
-                detail=f"Error en predicción: {resultado['error']}"
-            )
-        # ✅ CONVERTIR TIPOS NUMPY A NATIVOS
-        resultado_limpio = convert_to_native(resultado)
-        # Agregar metadata
-        resultado_limpio["metadata"] = {
-            "api_version": "1.0.0",
-            "model_version": "v4",
-            "timestamp": pd.Timestamp.now().isoformat()
-        }
-        return JSONResponse(
-            status_code=200,
-            content=resultado_limpio
-        )
-    except HTTPException:
-        # Re-lanzar excepciones HTTP
-        raise
-    except Exception as e:
-        # Capturar cualquier otro error
-        import traceback
-        error_detail = {
-            "error": str(e),
-            "type": type(e).__name__,
-            "traceback": traceback.format_exc() if app.debug else None
-        }
-        return JSONResponse(
-            status_code=500,
-            content=error_detail
         )

+# ===========================
+# SISTEMA DE PREDICCIÓN DE CORNERS - OPTIMIZADO PARA APUESTAS (VERSIÓN COMPLETA)
+# ===========================
+import numpy as np
+import pandas as pd
+import os
+from fastapi.responses import JSONResponse
+from fastapi import Depends, FastAPI, HTTPException
+from fastapi.security.api_key import APIKeyHeader
+from fastapi import Security
+from fastapi.responses import JSONResponse
+from dotenv import load_dotenv
+from src.api.load import USE_MODEL
+#from load import USE_MODEL
+load_dotenv()
+model = USE_MODEL()
+app = FastAPI()
+# ===========================
+# CONFIGURACIÓN API KEY
+# ===========================
+API_KEY = os.getenv("API_KEY")  # ⚠️ CÁMBIALA POR UNA SEGURA
+api_key_header = APIKeyHeader(name="X-API-Key", auto_error=False)
+async def get_api_key(api_key: str = Security(api_key_header)):
+    """Validar API Key"""
+    if api_key != API_KEY:
+        raise HTTPException(
+            status_code=401,
+            detail="API Key inválida o faltante"
+        )
+    return api_key
+# ===========================
+# HELPER: CONVERTIR NUMPY/PANDAS A TIPOS NATIVOS
+# ===========================
+def convert_to_native(val):
+    """Convierte tipos NumPy/Pandas a tipos nativos de Python"""
+    if isinstance(val, (np.integer, np.int64, np.int32, np.int16, np.int8)):
+        return int(val)
+    elif isinstance(val, (np.floating, np.float64, np.float32, np.float16)):
+        return float(val)
+    elif isinstance(val, np.ndarray):
+        return [convert_to_native(item) for item in val.tolist()]
+    elif isinstance(val, dict):
+        return {key: convert_to_native(value) for key, value in val.items()}
+    elif isinstance(val, (list, tuple)):
+        return [convert_to_native(item) for item in val]
+    elif isinstance(val, pd.Series):
+        return convert_to_native(val.to_dict())
+    elif isinstance(val, pd.DataFrame):
+        return convert_to_native(val.to_dict(orient='records'))
+    elif pd.isna(val):
+        return None
+    else:
+        return val
+# ===========================
+# ENDPOINTS
+# ===========================
+@app.get("/")
+def read_root():
+    """Endpoint raíz con información de la API"""
+    return {
+        "api": "Corners Prediction API",
+        "version": "1.0.0",
+        "status": "active",
+        "endpoints": {
+            "/": "Información de la API",
+            "/items/": "Predicción de corners (requiere API Key)",
+            "/health": "Estado de salud"
+        },
+        "auth": "Requiere header: X-API-Key"
+    }
+@app.get("/items/")
+def predict_corners(
+    local: str,
+    visitante: str,
+    jornada: int,
+    league_code: str,
+    temporada: str = "2526",
+    api_key: str = Depends(get_api_key)  # ✅ PROTEGIDO
+):
+    """
+    Predecir corners para un partido de fútbol
+    Args:
+        local: Nombre del equipo local (requerido)
+        visitante: Nombre del equipo visitante (requerido)
+        jornada: Número de jornada (requerido, min: 1)
+        league_code: Código de liga (requerido: ESP, GER, FRA, ITA, ENG, NED, POR, BEL)
+        temporada: Temporada en formato AABB (default: "2526")
+    Returns:
+        JSON con predicción y análisis completo
+    Example:
+        GET /items/?local=Barcelona&visitante=Real%20Madrid&jornada=15&league_code=ESP&temporada=2526
+        Headers: X-API-Key: tu-clave-secreta-aqui
+    """
+    # ===========================
+    # VALIDACIONES
+    # ===========================
+    # Validar campos obligatorios
+    if not local or not visitante:
+        raise HTTPException(
+            status_code=400,
+            detail="Los parámetros 'local' y 'visitante' son obligatorios"
+        )
+    # Validar jornada
+    if jornada < 1:
+        raise HTTPException(
+            status_code=400,
+            detail="La jornada debe ser mayor o igual a 1"
+        )
+    # Validar liga
+    valid_leagues = ["ESP", "GER", "FRA", "ITA", "ENG", "NED", "POR", "BEL"]
+    if league_code not in valid_leagues:
+        raise HTTPException(
+            status_code=400,
+            detail=f"Liga inválida. Ligas válidas: {', '.join(valid_leagues)}"
+        )
+    # ===========================
+    # PREDICCIÓN
+    # ===========================
+    try:
+        resultado = model.consume_model_single(
+            local=local,
+            visitante=visitante,
+            jornada=jornada,
+            temporada=temporada,
+            league_code=league_code
+        )
+        # Verificar si hubo error en la predicción
+        if resultado.get("error"):
+            raise HTTPException(
+                status_code=422,
+                detail=f"Error en predicción: {resultado['error']}"
+            )
+        # ✅ CONVERTIR TIPOS NUMPY A NATIVOS
+        resultado_limpio = convert_to_native(resultado)
+        # Agregar metadata
+        resultado_limpio["metadata"] = {
+            "api_version": "1.0.0",
+            "model_version": "v4",
+            "timestamp": pd.Timestamp.now().isoformat()
+        }
+        return JSONResponse(
+            status_code=200,
+            content=resultado_limpio
+        )
+    except HTTPException:
+        # Re-lanzar excepciones HTTP
+        raise
+    except Exception as e:
+        # Capturar cualquier otro error
+        import traceback
+        error_detail = {
+            "error": str(e),
+            "type": type(e).__name__,
+            "traceback": traceback.format_exc() if app.debug else None
+        }
+        return JSONResponse(
+            status_code=500,
+            content=error_detail
         )

src/api/load.py CHANGED Viewed

@@ -2,6 +2,8 @@
 # SISTEMA DE PREDICCIÓN DE CORNERS - OPTIMIZADO PARA APUESTAS (VERSIÓN COMPLETA)
 # ===========================
 import numpy as np
 import pandas as pd
 import joblib
@@ -9,9 +11,10 @@ from scipy.stats import poisson
 from scipy import stats
 import os
 import sys
-project_root = os.path.abspath(os.path.join(os.path.dirname(__file__), '../..'))
-sys.path.insert(0, project_root)
 # ===========================
 # 1. FUNCIONES FIABILIDAD
 # ===========================
@@ -311,6 +314,7 @@ def clasificar_confianza(prob):
     else:
         return "BAJA ❌"
 def get_dataframes(df, season, round_num, local, away, league=None):
     """Retorna 8 DataFrames filtrados por equipo, venue y liga"""
@@ -522,6 +526,8 @@ def get_ppp_difference(df, local, away, season, round_num, league=None):
     away_ppp = get_team_ppp(df, away, season, round_num, league)
     return local_ppp - away_ppp
 def predecir_corners(local, visitante, jornada, temporada="2526", league_code="ESP",df_database=pd.DataFrame(),xgb_model="",scaler="",lst_years=[]):
     """
     Predice corners totales con análisis completo para apuestas
@@ -1074,81 +1080,87 @@ class USE_MODEL():
         self.init_variables()
     def load_models(self):
-        """Cargar modelos con manejo de errores y rutas flexibles"""
-        # ===========================
-        # CONFIGURACIÓN DE RUTAS
-        # ===========================
-        # Obtener directorio raíz del proyecto
-        project_root = os.path.abspath(os.path.join(os.path.dirname(__file__), '../..'))
-        models_dir = os.path.join(project_root, 'models')
-        # Buscar archivos más recientes
-        model_files = [f for f in os.listdir(models_dir) if f.startswith('xgboost_corners') and f.endswith('.pkl')]
-        scaler_files = [f for f in os.listdir(models_dir) if f.startswith('scaler_corners') and f.endswith('.pkl')]
-        if not model_files or not scaler_files:
-            raise FileNotFoundError(
-                f"\n❌ ERROR: No se encontraron modelos en '{models_dir}'\n"
-                f"   Modelos disponibles: {model_files}\n"
-                f"   Scalers disponibles: {scaler_files}\n\n"
-                f"💡 Solución: Entrena un modelo primero ejecutando:\n"
-                f"   python src/models/train_model.py\n"
-            )
-        # Tomar el más reciente (o específico)
-        model_file = sorted(model_files)[-1]  # Último alfabéticamente
-        scaler_file = sorted(scaler_files)[-1]
-        model_path = os.path.join(models_dir, model_file)
-        scaler_path = os.path.join(models_dir, scaler_file)
-        print(f"📦 Cargando modelo: {model_file}")
-        print(f"📦 Cargando scaler: {scaler_file}")
         try:
-            self.xgb_model = joblib.load(model_path)
-            self.scaler = joblib.load(scaler_path)
-            print("✅ Modelos cargados correctamente")
         except Exception as e:
             raise Exception(f"❌ Error cargando modelos: {str(e)}")
     def load_data(self):
-        """Cargar datos con manejo de errores"""
-        project_root = os.path.abspath(os.path.join(os.path.dirname(__file__), '../..'))
-        historic_path = os.path.join(project_root, "dataset/cleaned/dataset_cleaned.csv")
-        current_path = os.path.join(project_root, "dataset/cleaned/dataset_cleaned_current_year.csv")
-        print(f"📂 Buscando datos en: {historic_path}")
-        if not os.path.exists(historic_path):
             raise FileNotFoundError(
-                f"\n❌ ERROR: No se encontró dataset histórico\n"
-                f"   Ruta buscada: {historic_path}\n\n"
-                f"💡 Solución: Genera el dataset ejecutando:\n"
-                f"   python src/process_data/generate_dataset.py\n"
             )
-        self.df_dataset_historic = pd.read_csv(historic_path)
-        print(f"✅ Dataset histórico cargado: {len(self.df_dataset_historic)} registros")
-        # Intentar cargar año actual
-        if os.path.exists(current_path):
-            self.df_dataset_current_year = pd.read_csv(current_path)
-            print(f"✅ Dataset año actual cargado: {len(self.df_dataset_current_year)} registros")
-            self.df_dataset = pd.concat([self.df_dataset_historic, self.df_dataset_current_year])
-        else:
-            print("⚠️ No se encontró dataset del año actual, usando solo histórico")
-            self.df_dataset = self.df_dataset_historic
-        # Limpieza
-        self.df_dataset["season"] = self.df_dataset["season"].astype(str)
-        self.df_dataset["Performance_Save%"].fillna(0, inplace=True)
-        print(f"✅ Total registros: {len(self.df_dataset)}")
     def init_variables(self):
         self.lst_years = ["1819", "1920", "2021", "2122", "2223", "2324", "2425", "2526"]

 # SISTEMA DE PREDICCIÓN DE CORNERS - OPTIMIZADO PARA APUESTAS (VERSIÓN COMPLETA)
 # ===========================
+import requests
+import tempfile
 import numpy as np
 import pandas as pd
 import joblib
 from scipy import stats
 import os
 import sys
+from src.process_data.process_dataset import get_dataframes,get_head_2_head,get_points_from_result,get_team_ppp,get_ppp_difference,get_average
+#from process_data.process_dataset import get_dataframes,get_head_2_head,get_points_from_result,get_team_ppp,get_ppp_difference,get_average
+#project_root = os.path.abspath(os.path.join(os.path.dirname(__file__), '../..'))
+#sys.path.insert(0, project_root)
 # ===========================
 # 1. FUNCIONES FIABILIDAD
 # ===========================
     else:
         return "BAJA ❌"
+'''
 def get_dataframes(df, season, round_num, local, away, league=None):
     """Retorna 8 DataFrames filtrados por equipo, venue y liga"""
     away_ppp = get_team_ppp(df, away, season, round_num, league)
     return local_ppp - away_ppp
+'''
 def predecir_corners(local, visitante, jornada, temporada="2526", league_code="ESP",df_database=pd.DataFrame(),xgb_model="",scaler="",lst_years=[]):
     """
     Predice corners totales con análisis completo para apuestas
         self.init_variables()
     def load_models(self):
+        """Cargar modelos desde GitHub usando raw URLs"""
+        print("📦 Cargando modelos desde GitHub...")
+        # URLs de descarga directa (raw.githubusercontent.com)
+        base_url = "https://raw.githubusercontent.com/danielsaed/futbol_corners_forecast/refs/heads/main/models"
+        model_url = f"{base_url}/xgboost_corners_v4_retrain.pkl"
+        scaler_url = f"{base_url}/scaler_corners_v4_retrain.pkl"
         try:
+            # Descargar modelo
+            print(f"📥 Descargando modelo desde: {model_url}")
+            response_model = requests.get(model_url, timeout=30)
+            response_model.raise_for_status()
+            # Descargar scaler
+            print(f"📥 Descargando scaler desde: {scaler_url}")
+            response_scaler = requests.get(scaler_url, timeout=30)
+            response_scaler.raise_for_status()
+            # Guardar temporalmente y cargar
+            with tempfile.NamedTemporaryFile(delete=False, suffix='.pkl') as tmp_model:
+                tmp_model.write(response_model.content)
+                tmp_model_path = tmp_model.name
+            with tempfile.NamedTemporaryFile(delete=False, suffix='.pkl') as tmp_scaler:
+                tmp_scaler.write(response_scaler.content)
+                tmp_scaler_path = tmp_scaler.name
+            # Cargar modelos desde archivos temporales
+            self.xgb_model = joblib.load(tmp_model_path)
+            self.scaler = joblib.load(tmp_scaler_path)
+            # Limpiar archivos temporales
+            os.unlink(tmp_model_path)
+            os.unlink(tmp_scaler_path)
+            print("✅ Modelos cargados correctamente desde GitHub")
+        except requests.exceptions.RequestException as e:
+            raise Exception(f"❌ Error descargando modelos: {str(e)}")
         except Exception as e:
             raise Exception(f"❌ Error cargando modelos: {str(e)}")
     def load_data(self):
+        """Cargar datos desde GitHub"""
+        print("📂 Cargando datos desde GitHub...")
+        base_url = "https://raw.githubusercontent.com/danielsaed/futbol_corners_forecast/refs/heads/main/dataset/cleaned"
+        historic_url = f"{base_url}/dataset_cleaned.csv"
+        current_url = f"{base_url}/dataset_cleaned_current_year.csv"
+        try:
+            # Cargar dataset histórico
+            print(f"📥 Descargando dataset histórico...")
+            self.df_dataset_historic = pd.read_csv(historic_url)
+            print(f"✅ Dataset histórico cargado: {len(self.df_dataset_historic)} registros")
+            # Intentar cargar año actual
+            try:
+                print(f"📥 Descargando dataset año actual...")
+                self.df_dataset_current_year = pd.read_csv(current_url)
+                print(f"✅ Dataset año actual cargado: {len(self.df_dataset_current_year)} registros")
+                self.df_dataset = pd.concat([self.df_dataset_historic, self.df_dataset_current_year])
+            except:
+                print("⚠️ No se pudo cargar dataset del año actual, usando solo histórico")
+                self.df_dataset = self.df_dataset_historic
+            # Limpieza
+            self.df_dataset["season"] = self.df_dataset["season"].astype(str)
+            self.df_dataset["Performance_Save%"].fillna(0, inplace=True)
+            print(f"✅ Total registros: {len(self.df_dataset)}")
+        except Exception as e:
             raise FileNotFoundError(
+                f"\n❌ ERROR: No se pudieron cargar los datos desde GitHub\n"
+                f"   Error: {str(e)}\n\n"
+                f"💡 Verifica que los archivos existan en el repositorio\n"
             )
     def init_variables(self):
         self.lst_years = ["1819", "1920", "2021", "2122", "2223", "2324", "2425", "2526"]