Spaces:

jpbernardo
/

CHAT_IEPG_GRADIO

Sleeping

App Files Files Community

jpbernardo commited on Nov 23, 2025

Commit

8fdf050

verified ·

1 Parent(s): f401b6a

Update app.py

Browse files

Files changed (1) hide show

app.py +30 -30

app.py CHANGED Viewed

@@ -75,8 +75,8 @@ class Retriever:
 # -------------- carregar modelo leve de geração --------------
 def carregar_generator():
-    model_name = "google/flan-t5-small"
-    # model_name = "tgsc/ult5-pt-small"
     device = 0 if torch.cuda.is_available() else -1
     tok = AutoTokenizer.from_pretrained(model_name)
@@ -106,44 +106,44 @@ except Exception as e:
 # -------------- prompt/template --------------
-def montar_prompt(pergunta: str, fontes: List[dict]) -> str:
-    conteudos = []
-    for f in fontes:
-        texto = f["text"][:400]
-        conteudos.append(f"(p.{f['page']}) {texto}")
-    base = "\n\n".join(conteudos)
-    # 🔧 ALTERAÇÃO — Prompt sem terminar com "Resposta:"
-    prompt = (
-        f"Responda claramente à pergunta usando APENAS o contexto abaixo.\n\n"
-        f"Contexto:\n{base}\n\n"
-        f"Pergunta: {pergunta}\n\n"
-        f"Resposta detalhada:"
-    )
-    return prompt
 # def montar_prompt(pergunta: str, fontes: List[dict]) -> str:
 #     conteudos = []
 #     for f in fontes:
-#         texto = f["text"][:400]  # limite
 #         conteudos.append(f"(p.{f['page']}) {texto}")
 #     base = "\n\n".join(conteudos)
-#     # 🔧 PROMPT OTIMIZADO PARA ULT5
 #     prompt = (
-#         "Você é um assistente que responde perguntas usando APENAS os trechos abaixo.\n"
-#         "Resuma seu raciocínio e responda de forma objetiva. Não repita trechos do contexto.\n"
-#         "Quando terminar a resposta, escreva o marcador <FIM>.\n\n"
-#         f"CONTEXT0:\n{base}\n\n"
-#         f"PERGUNTA:\n{pergunta}\n\n"
-#         "RESPOSTA (não copie o contexto; responda de forma curta):"
 #     )
 #     return prompt
 # PROMPT_PREFIX = (
 #     "Primeiramente, inicie a resposta sempre com 'Oi, querido!'.\n\n"
@@ -210,8 +210,8 @@ def rag_chat(user_msg, history):
     saida = generator(prompt)[0]["generated_text"].strip()
     # # 🔧 cortar no marcador de parada
-    # if "<FIM>" in saida:
-    #     saida = saida.split("<FIM>")[0].strip()
     # 🔧 ALTERAÇÃO 6 — adicionar "Oi, querido!" apenas na saída (não no prompt)
     if not saida.lower().startswith("oi, querido"):

 # -------------- carregar modelo leve de geração --------------
 def carregar_generator():
+    # model_name = "google/flan-t5-small"
+    model_name = "tgsc/ult5-pt-small"
     device = 0 if torch.cuda.is_available() else -1
     tok = AutoTokenizer.from_pretrained(model_name)
 # -------------- prompt/template --------------
 # def montar_prompt(pergunta: str, fontes: List[dict]) -> str:
 #     conteudos = []
 #     for f in fontes:
+#         texto = f["text"][:400]
 #         conteudos.append(f"(p.{f['page']}) {texto}")
 #     base = "\n\n".join(conteudos)
+#     # 🔧 ALTERAÇÃO — Prompt sem terminar com "Resposta:"
 #     prompt = (
+#         f"Responda claramente à pergunta usando APENAS o contexto abaixo.\n\n"
+#         f"Contexto:\n{base}\n\n"
+#         f"Pergunta: {pergunta}\n\n"
+#         f"Resposta detalhada:"
 #     )
 #     return prompt
+def montar_prompt(pergunta: str, fontes: List[dict]) -> str:
+    conteudos = []
+    for f in fontes:
+        texto = f["text"][:400]  # limite
+        conteudos.append(f"(p.{f['page']}) {texto}")
+    base = "\n\n".join(conteudos)
+    # 🔧 PROMPT OTIMIZADO PARA ULT5
+    prompt = (
+        "Você é um assistente que responde perguntas usando APENAS os trechos abaixo.\n"
+        "Resuma seu raciocínio e responda de forma objetiva. Não repita trechos do contexto.\n"
+        "Quando terminar a resposta, escreva o marcador <FIM>.\n\n"
+        f"CONTEXT0:\n{base}\n\n"
+        f"PERGUNTA:\n{pergunta}\n\n"
+        "RESPOSTA (não copie o contexto; responda de forma curta):"
+    )
+    return prompt
 # PROMPT_PREFIX = (
 #     "Primeiramente, inicie a resposta sempre com 'Oi, querido!'.\n\n"
     saida = generator(prompt)[0]["generated_text"].strip()
     # # 🔧 cortar no marcador de parada
+    if "<FIM>" in saida:
+        saida = saida.split("<FIM>")[0].strip()
     # 🔧 ALTERAÇÃO 6 — adicionar "Oi, querido!" apenas na saída (não no prompt)
     if not saida.lower().startswith("oi, querido"):