Spaces:

Finish-him
/

Prometheus-detran

Runtime error

App Files Files Community

Finish-him commited on Oct 20, 2025

Commit

7a3f8ea

verified ·

1 Parent(s): 0ef31de

Update app.py

Browse files

Files changed (1) hide show

app.py +14 -30

app.py CHANGED Viewed

@@ -1,63 +1,52 @@
-import os
 import gradio as gr
 from langchain_community.document_loaders import PyPDFDirectoryLoader
 from langchain_text_splitters import RecursiveCharacterTextSplitter
 from langchain_community.embeddings import HuggingFaceEmbeddings
 from langchain_community.vectorstores import FAISS
-from langchain.chains import RetrievalQA  # Esta linha foi corrigida implicitamente pela estrutura do Langchain
 from langchain_community.llms import HuggingFaceHub
 # --- PASSO 1: CARREGAR OS DOCUMENTOS ---
-# Carrega todos os arquivos .pdf da pasta 'data'
 loader = PyPDFDirectoryLoader("data")
 documents = loader.load()
 # --- PASSO 2: PROCESSAR E DIVIDIR O TEXTO ---
-# Divide os documentos em pedaços menores (chunks) para facilitar a busca
 text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=150)
 docs = text_splitter.split_documents(documents)
 # --- PASSO 3: CRIAR EMBEDDINGS E O BANCO DE DADOS VETORIAL ---
-# Escolhe um modelo de embedding do Hugging Face. Este é ótimo para textos em português.
 model_name = "sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2"
 embeddings = HuggingFaceEmbeddings(model_name=model_name)
-# Cria o banco de dados vetorial (FAISS) a partir dos pedaços de texto e dos embeddings
-# Isso cria um "índice" que permite buscar os trechos mais relevantes rapidamente
 db = FAISS.from_documents(docs, embeddings)
 # --- PASSO 4: CONFIGURAR O MODELO DE LINGUAGEM (LLM) E A CADEIA DE BUSCA ---
-# Configura o acesso ao LLM do Hugging Face.
-# O token será lido automaticamente do segredo que você configurou no Space.
-repo_id = "mistralai/Mixtral-8x7B-Instruct-v0.1" # Um modelo poderoso
 llm = HuggingFaceHub(
     repo_id=repo_id,
-    model_kwargs={"temperature": 0.1, "max_new_tokens": 1024} # Aumentei um pouco para respostas mais completas
 )
-# Cria a "cadeia" (chain) de RetrievalQA. É aqui que a mágica acontece.
-# Ele conecta o LLM com o banco de dados vetorial.
 qa_chain = RetrievalQA.from_chain_type(
     llm=llm,
     chain_type="stuff",
-    retriever=db.as_retriever(search_kwargs={"k": 3}), # Busca os 3 trechos mais relevantes
-    return_source_documents=False # Simplificado para retornar apenas o texto final
 )
 # --- PASSO 5: CRIAR A INTERFACE COM O GRADIO ---
-# Define a função que será chamada pela interface
 def process_query(query):
-    # O LangChain pode retornar textos com formatação estranha ou avisos.
-    # Vamos limpar a resposta para mostrar apenas o resultado principal.
     try:
-        result = qa_chain.invoke(query) # Usando .invoke() que é a forma mais moderna
         answer = result.get('result', 'Não foi possível encontrar uma resposta.')
         return answer
     except Exception as e:
-        print(e) # Imprime o erro nos logs para depuração
         return "Ocorreu um erro ao processar sua pergunta. Verifique os logs do Space."
-# Cria a interface web
 with gr.Blocks(theme=gr.themes.Soft()) as demo:
     gr.Markdown("# 🤖 Assistente de Análise do Contrato DETRAN-RJ")
     gr.Markdown("Faça uma pergunta sobre os documentos do contrato e o assistente buscará a resposta nos arquivos.")
@@ -68,10 +57,9 @@ with gr.Blocks(theme=gr.themes.Soft()) as demo:
     out = gr.Markdown(label="Resposta")
-    btn.click(process_query, inputs=inp, outputs=out)
-    inp.submit(process_query, inputs=inp, outputs=out) # Permite usar Enter
-    # Adiciona alguns exemplos de perguntas
     gr.Examples(
         examples=[
             "Qual o objeto do contrato?",
@@ -80,11 +68,7 @@ with gr.Blocks(theme=gr.themes.Soft()) as demo:
             "Qual o prazo de vigência do contrato?",
             "Qual a empresa contratada?",
         ],
-        inputs=inp,
-        outputs=out,
-        fn=process_query,
-        cache_examples=False # Evita erros de cache com exemplos
     )
-# Lança a aplicação
 demo.launch()

 import gradio as gr
 from langchain_community.document_loaders import PyPDFDirectoryLoader
 from langchain_text_splitters import RecursiveCharacterTextSplitter
 from langchain_community.embeddings import HuggingFaceEmbeddings
 from langchain_community.vectorstores import FAISS
+from langchain.chains import RetrievalQA
 from langchain_community.llms import HuggingFaceHub
 # --- PASSO 1: CARREGAR OS DOCUMENTOS ---
 loader = PyPDFDirectoryLoader("data")
 documents = loader.load()
 # --- PASSO 2: PROCESSAR E DIVIDIR O TEXTO ---
 text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=150)
 docs = text_splitter.split_documents(documents)
 # --- PASSO 3: CRIAR EMBEDDINGS E O BANCO DE DADOS VETORIAL ---
 model_name = "sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2"
 embeddings = HuggingFaceEmbeddings(model_name=model_name)
 db = FAISS.from_documents(docs, embeddings)
 # --- PASSO 4: CONFIGURAR O MODELO DE LINGUAGEM (LLM) E A CADEIA DE BUSCA ---
+repo_id = "mistralai/Mixtral-8x7B-Instruct-v0.1"
 llm = HuggingFaceHub(
     repo_id=repo_id,
+    model_kwargs={"temperature": 0.2, "max_new_tokens": 1024}
 )
+# A linha abaixo é a que estava causando o erro.
+# A classe 'RetrievalQA' está de fato no pacote principal 'langchain'.
 qa_chain = RetrievalQA.from_chain_type(
     llm=llm,
     chain_type="stuff",
+    retriever=db.as_retriever(search_kwargs={"k": 3}),
+    return_source_documents=False
 )
 # --- PASSO 5: CRIAR A INTERFACE COM O GRADIO ---
 def process_query(query):
     try:
+        # Usando o método .invoke(), que é a forma moderna de chamar a chain
+        result = qa_chain.invoke(query)
+        # Limpando a resposta para extrair apenas o texto principal
         answer = result.get('result', 'Não foi possível encontrar uma resposta.')
         return answer
     except Exception as e:
+        print(e)  # Imprime o erro nos logs para depuração
         return "Ocorreu um erro ao processar sua pergunta. Verifique os logs do Space."
 with gr.Blocks(theme=gr.themes.Soft()) as demo:
     gr.Markdown("# 🤖 Assistente de Análise do Contrato DETRAN-RJ")
     gr.Markdown("Faça uma pergunta sobre os documentos do contrato e o assistente buscará a resposta nos arquivos.")
     out = gr.Markdown(label="Resposta")
+    btn.click(fn=process_query, inputs=inp, outputs=out)
+    inp.submit(fn=process_query, inputs=inp, outputs=out)
     gr.Examples(
         examples=[
             "Qual o objeto do contrato?",
             "Qual o prazo de vigência do contrato?",
             "Qual a empresa contratada?",
         ],
+        inputs=inp
     )
 demo.launch()