Spaces:

Loren
/

api_search_articles

Sleeping

App Files Files Community

Loren commited on Nov 19, 2025

Commit

e17b15a

verified ·

1 Parent(s): ee3ce36

Update app/main.py

Browse files

Files changed (1) hide show

app/main.py +2 -84

app/main.py CHANGED Viewed

@@ -7,23 +7,13 @@ from fastapi.responses import HTMLResponse
 from pydantic import BaseModel
 from transformers import AutoModelForCausalLM, AutoTokenizer
 import torch
-from app.templates.prompt_mistral_rag import RAG_PROMPT_TEMPLATE
 app = FastAPI(
     title="Articles API",
-    description="API pour récupérer articles et tags depuis SQLite",
     version="1.0"
 )
-# Chargement du modèle génératif
-MODEL_NAME = "mistralai/Mistral-7B-Instruct-v0.3"
-tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
-model = AutoModelForCausalLM.from_pretrained(MODEL_NAME,
-                                             torch_dtype=torch.float16,
-                                             device_map="auto"
-                                            )
 # CORS pour permettre l'accès depuis le navigateur
 app.add_middleware(
     CORSMiddleware,
@@ -152,76 +142,4 @@ def get_query_results(query: str = Query(..., description="Requête de recherche
     except Exception as e:
         return {"status": "error", "code": type(e).__name__, "message": str(e)}
-#
-class QueryRequest(BaseModel):
-    question: str
-    use_rerank: bool = True
-@app.post("/get_answer")
-async def ask_question(request: QueryRequest):
-    """
-    Traite une question utilisateur en effectuant une recherche dans la base de données
-    puis en générant une réponse à l’aide du modèle de langage (RAG).
-    Le fonctionnement se déroule en trois étapes :
-    1. Extraction et nettoyage de la question utilisateur.
-    2. Recherche des passages pertinents dans la base de données (`fetch_query_results`).
-    3. Génération d’une réponse fondée sur les morceaux de texte récupérés (RAG).
-    Paramètres
-    ----------
-    request : QueryRequest
-        Objet contenant la question utilisateur sous forme de chaîne de caractères.
-    Retour
-    ------
-    dict
-        Un dictionnaire contenant :
-        - "status" : "ok" si la requête a réussi, "error" en cas d'échec.
-        - "results" : liste des chunks retournés par la base de données (présent seulement si status = "ok").
-        - "answer" : réponse générée par le modèle ou message d’erreur.
-    Exceptions
-    ----------
-    Toute exception survenant durant l’exécution est interceptée
-    et retournée sous forme d’un message d’erreur dans la clé "answer".
-    Notes
-    -----
-    - Si aucun chunk pertinent n'est trouvé, la fonction renvoie un message indiquant
-      que seules les questions relatives aux articles du jeu de données peuvent être traitées.
-    - La génération de la réponse utilise un template RAG et produit jusqu’à 500 tokens.
-    """
-    try:
-        user_query = request.question.strip()
-        use_rerank = request.use_rerank
-        dict_result = database.fetch_query_results(user_query, k_model=10,
-                                                   k_cross=5, use_rerank=use_rerank)
-        if dict_result["status"] == "ok":
-            list_chunks = [resp['chunk_text'] for resp in dict_result['result']]
-            if not list_chunks:
-                answer = ("Je ne dispose pas d’informations sur ce sujet. "
-                          "Je peux uniquement répondre à des questions sur les articles " \
-                          "du jeu de données.")
-            else:
-                # Construction du prompt
-                prompt = RAG_PROMPT_TEMPLATE.format(
-                    context="\n".join(list_chunks),
-                    question=user_query
-                )
-                # Génération de la réponse
-                inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
-                outputs = model.generate(**inputs, max_new_tokens=500)
-                generated_tokens = outputs[0][inputs["input_ids"].shape[-1]:]  # uniquement la partie générée
-                answer = tokenizer.decode(generated_tokens, skip_special_tokens=True).strip()
-            return {"status": "ok",
-                    "results": dict_result["result"],
-                    "answer": answer}
-        else:
-            answer = f"Une erreur est survenue lors de la récupération des informations : \
-                       {dict_result['code']} - {dict_result['message']}."
-            return {"status": "error", "answer": answer}
-    except Exception as e:
-        answer = f"Une erreur est survenue lors de la récupération des informations : \
-                       {type(e).__name__} - {str(e)}."
-        return {"status": "error", "answer": answer}

 from pydantic import BaseModel
 from transformers import AutoModelForCausalLM, AutoTokenizer
 import torch
 app = FastAPI(
     title="Articles API",
+    description="API pour interroger la base articles",
     version="1.0"
 )
 # CORS pour permettre l'accès depuis le navigateur
 app.add_middleware(
     CORSMiddleware,
     except Exception as e:
         return {"status": "error", "code": type(e).__name__, "message": str(e)}
+#