Spaces:

vinimoreira
/

RAG_backend

Sleeping

App Files Files Community

vinimoreira commited on Jul 2, 2025

Commit

bd4d787

verified ·

1 Parent(s): bcbc37c

update rag_chain

Browse files

Files changed (1) hide show

api/rag_chain.py +2 -19

api/rag_chain.py CHANGED Viewed

@@ -5,13 +5,13 @@ from pathlib import Path
 from dotenv import load_dotenv
 from operator import itemgetter
 from typing import List, Dict
 from langchain_core.runnables import RunnableParallel, RunnablePassthrough, RunnableLambda
 from langchain_core.prompts import PromptTemplate
 from langchain_community.vectorstores import FAISS
 from langchain_huggingface import HuggingFaceEmbeddings
 from huggingface_hub import InferenceClient
 from src.retrieval.reranker import HybridReranker
 load_dotenv()
@@ -25,25 +25,8 @@ if not HF_TOKEN:
     raise ValueError("token api not found")
 client = InferenceClient(model=LLM_REPO_ID, token=HF_TOKEN)
-prompt_template = PromptTemplate.from_template("""[INST]
-Sua tarefa é agir como um assistente de helpdesk de TI objetivo e técnico. Você deve responder à pergunta do usuário usando estritamente as informações contidas na seção <CONTEXTO>.
-**REGRAS ABSOLUTAS:**
-1. Responda SEMPRE em Português do Brasil.
-2. NUNCA mencione a palavra "contexto" ou "fonte" na sua resposta. Apenas use a informação.
-3. NUNCA repita a pergunta do usuário. Gere apenas a resposta direta para a pergunta.
-4. Se a informação não estiver no contexto, responda EXATAMENTE com a frase: "Não encontrei informações sobre isso na minha base de dados."
-5. Baseie-se 100% no texto dentro de <CONTEXTO>. Não adicione nenhuma informação externa.
-<CONTEXTO>
-{context}
-</CONTEXTO>
-<PERGUNTA>
-{query}
-</PERGUNTA>
-[/INST]
-""")
 def format_docs(docs: List[Dict]) -> str:
     return "\n\n".join(doc.page_content for doc in docs)

 from dotenv import load_dotenv
 from operator import itemgetter
 from typing import List, Dict
 from langchain_core.runnables import RunnableParallel, RunnablePassthrough, RunnableLambda
 from langchain_core.prompts import PromptTemplate
 from langchain_community.vectorstores import FAISS
 from langchain_huggingface import HuggingFaceEmbeddings
 from huggingface_hub import InferenceClient
 from src.retrieval.reranker import HybridReranker
+from src.generation.prompt_templates import RAG_PROMPT_TEMPLATE
 load_dotenv()
     raise ValueError("token api not found")
 client = InferenceClient(model=LLM_REPO_ID, token=HF_TOKEN)
+prompt_template = PromptTemplate.from_template(RAG_PROMPT_TEMPLATE)
 def format_docs(docs: List[Dict]) -> str:
     return "\n\n".join(doc.page_content for doc in docs)