Spaces:

fcp2207
/

ChatBotIME

Paused

App Files Files Community

felipecaspol commited on Mar 11, 2025

Commit

84ab11b

1 Parent(s): 39b5a26

Forzando actualización de api.py en Hugging Face

Browse files

Files changed (1) hide show

api.py +42 -8

api.py CHANGED Viewed

@@ -1,28 +1,62 @@
 from fastapi import FastAPI
 from transformers import AutoModelForCausalLM, AutoTokenizer
 import torch
-# Inicializar FastAPI
 app = FastAPI()
-# Cargar modelo y tokenizer
-MODEL_PATH = "models/phi2_finetuned_full"
-tokenizer = AutoTokenizer.from_pretrained(MODEL_PATH)
-model = AutoModelForCausalLM.from_pretrained(MODEL_PATH, torch_dtype=torch.float16, device_map="cpu")
 @app.get("/")
 def home():
-    return {"message": "API de Chatbot con Phi-2 está en funcionamiento"}
 @app.post("/predict/")
-def predict(input_text: str):
     """Genera una respuesta basada en el input del usuario."""
-    inputs = tokenizer(input_text, return_tensors="pt", padding=True, truncation=True, max_length=512)
     with torch.no_grad():
         outputs = model.generate(**inputs, max_length=150)
     response_text = tokenizer.decode(outputs[0], skip_special_tokens=True)
     return {"response": response_text}
 if __name__ == "__main__":
     import uvicorn
     uvicorn.run(app, host="0.0.0.0", port=8000)

+# Actualización forzada para subir a Hugging Face..
 from fastapi import FastAPI
+from pydantic import BaseModel
 from transformers import AutoModelForCausalLM, AutoTokenizer
 import torch
+from huggingface_hub import hf_hub_download
+# ✅ Inicializar FastAPI
 app = FastAPI()
+# ✅ Nombre del modelo en Hugging Face Hub
+HUGGING_FACE_REPO = "fcp2207/Phi-2"  # Asegúrate de que sea el nombre correcto en Hugging Face
+MODEL_FILENAME = "phi2_finetuned.pth"  # Nombre del archivo en Hugging Face
+# ✅ Descargar el modelo desde Hugging Face (sin autenticación)
+model_path = hf_hub_download(
+    repo_id=HUGGING_FACE_REPO,
+    filename=MODEL_FILENAME
+)
+# ✅ Cargar el tokenizer y el modelo base
+tokenizer = AutoTokenizer.from_pretrained("microsoft/phi-2")
+model = AutoModelForCausalLM.from_pretrained("microsoft/phi-2")
+# ✅ Cargar los pesos del modelo
+model.load_state_dict(torch.load(model_path, map_location="cpu"))
+model.eval()  # Poner el modelo en modo inferencia
+# ✅ Definir la estructura de la solicitud para la API
+class InputText(BaseModel):
+    input_text: str
 @app.get("/")
 def home():
+    """Endpoint de prueba para verificar que la API está activa"""
+    return {"message": "API de Chatbot con Phi-2 está en funcionamiento 🚀"}
 @app.post("/predict/")
+def predict(request: InputText):
     """Genera una respuesta basada en el input del usuario."""
+    inputs = tokenizer(request.input_text, return_tensors="pt", padding=True, truncation=True, max_length=512)
     with torch.no_grad():
         outputs = model.generate(**inputs, max_length=150)
     response_text = tokenizer.decode(outputs[0], skip_special_tokens=True)
     return {"response": response_text}
+# ✅ Ejecución en modo local (opcional, no necesario en Hugging Face)
 if __name__ == "__main__":
     import uvicorn
     uvicorn.run(app, host="0.0.0.0", port=8000)