Spaces:

luansouza4444
/

LegisMinerRAGAPI

Sleeping

App Files Files Community

luansouza4444 commited on Jun 19, 2025

Commit

ccdd1cb

verified ·

1 Parent(s): a35e3d3

Update app.py

Browse files

Files changed (1) hide show

app.py +29 -17

app.py CHANGED Viewed

@@ -6,8 +6,7 @@ Automatically generated by Colab.
 Original file is located at
     https://colab.research.google.com/drive/1PhcQoTZvxdPQe6E1HMx_Nl4Zs_tY7J_y
 """
 import gradio as gr
 import os
@@ -18,6 +17,7 @@ from langchain.embeddings import HuggingFaceEmbeddings
 from langchain.vectorstores import FAISS
 from langchain.text_splitter import RecursiveCharacterTextSplitter
 from langchain.chains import RetrievalQA
 import tempfile
 import numpy as np
 from sklearn.metrics.pairwise import cosine_similarity
@@ -29,18 +29,28 @@ OPENROUTER_API_KEY = os.getenv("ROUTER_API_KEY")
 if not OPENROUTER_API_KEY:
     raise ValueError("❌ A variável de ambiente ROUTER_API_KEY não está definida. Verifique o arquivo .env.")
-# Inicialização
-embeddings = HuggingFaceEmbeddings(model_name="sentence-transformers/all-MiniLM-L6-v2")
 qa_chain = None
 processed_file = None
-# 🔁 Carrega automaticamente o legisMiner.pdf ao iniciar
 def load_default_pdf():
     global qa_chain, processed_file
     try:
         loader = PyPDFLoader("LegisMiner.pdf")
         documents = loader.load()
         text_splitter = RecursiveCharacterTextSplitter(chunk_size=800, chunk_overlap=300)
         docs = text_splitter.split_documents(documents)
@@ -49,8 +59,8 @@ def load_default_pdf():
         llm = ChatOpenAI(
             openai_api_key=OPENROUTER_API_KEY,
             openai_api_base="https://openrouter.ai/api/v1",
-            model="mistralai/mistral-7b-instruct:free",
-            temperature=0.7
         )
         qa_chain = RetrievalQA.from_chain_type(
@@ -60,7 +70,7 @@ def load_default_pdf():
         )
         processed_file = "LegisMiner.pdf"
-        print("✅ LegisMiner.pdf carregado automaticamente.")
     except Exception as e:
         print(f"❌ Erro ao carregar LegisMiner.pdf automaticamente: {e}")
@@ -99,6 +109,9 @@ def process_pdf(file):
         loader = PyPDFLoader(pdf_path)
         documents = loader.load()
         text_splitter = RecursiveCharacterTextSplitter(chunk_size=800, chunk_overlap=300)
         docs = text_splitter.split_documents(documents)
@@ -107,8 +120,8 @@ def process_pdf(file):
         llm = ChatOpenAI(
             openai_api_key=OPENROUTER_API_KEY,
             openai_api_base="https://openrouter.ai/api/v1",
-            model="mistralai/mistral-7b-instruct:free",
-            temperature=0.7
         )
         qa_chain = RetrievalQA.from_chain_type(
@@ -130,13 +143,12 @@ def ask_question(question):
         return "⚠️ Por favor, carregue um PDF primeiro", "", {}
     try:
-        # ✅ Prompt especializado: Analista de Normas Regulatórias de Mineração
         system_prompt = (
-            "Você é um Analista Técnico em Normas Regulatórias de Mineração do Brasil. "
-            "Responda exclusivamente com base nas normas e informações contidas no PDF LegisMiner.pdf. "
-            "Seja direto, preciso e fundamente suas respostas com base no conteúdo técnico disponível. "
-            "Se a resposta não estiver no documento, diga claramente que a informação não está disponível."
         )
         resposta = qa_chain.invoke({
@@ -144,7 +156,7 @@ def ask_question(question):
         })
         sources = "\n\n".join(
-            [f"📄 Fonte {i+1}:\n{doc.page_content[:500]}..."
              for i, doc in enumerate(resposta['source_documents'])]
         )

 Original file is located at
     https://colab.research.google.com/drive/1PhcQoTZvxdPQe6E1HMx_Nl4Zs_tY7J_y
 """
+# Autor: Luan Alysson de Souza
 import gradio as gr
 import os
 from langchain.vectorstores import FAISS
 from langchain.text_splitter import RecursiveCharacterTextSplitter
 from langchain.chains import RetrievalQA
+from langchain.schema import Document
 import tempfile
 import numpy as np
 from sklearn.metrics.pairwise import cosine_similarity
 if not OPENROUTER_API_KEY:
     raise ValueError("❌ A variável de ambiente ROUTER_API_KEY não está definida. Verifique o arquivo .env.")
+# 🔍 Embeddings mais robustos
+embeddings = HuggingFaceEmbeddings(model_name="sentence-transformers/all-mpnet-base-v2")
 qa_chain = None
 processed_file = None
+# ✅ Trecho manualmente injetado com a tabela crítica de fator de segurança
+fator_seg_texto = """
+Art. 23. Cabe ao profissional legalmente habilitado calcular os Fatores de Segurança para as barragens de mineração,
+sendo exigido valor igual ou superior a 1,30 para resistência de pico (condição não drenada, global ou local).
+§ 3º Quando o Fator de Segurança estiver abaixo dos valores mínimos, o empreendedor deve interromper imediatamente
+o lançamento de efluentes e notificar a ANM.
+"""
 def load_default_pdf():
     global qa_chain, processed_file
     try:
         loader = PyPDFLoader("LegisMiner.pdf")
         documents = loader.load()
+        # ➕ Adiciona o trecho crítico manualmente como documento extra
+        documents.append(Document(page_content=fator_seg_texto, metadata={"source": "manual_injection"}))
         text_splitter = RecursiveCharacterTextSplitter(chunk_size=800, chunk_overlap=300)
         docs = text_splitter.split_documents(documents)
         llm = ChatOpenAI(
             openai_api_key=OPENROUTER_API_KEY,
             openai_api_base="https://openrouter.ai/api/v1",
+            model="meta-llama/llama-3-8b-instruct:free",
+            temperature=0.3
         )
         qa_chain = RetrievalQA.from_chain_type(
         )
         processed_file = "LegisMiner.pdf"
+        print("✅ LegisMiner.pdf carregado automaticamente com trecho crítico injetado.")
     except Exception as e:
         print(f"❌ Erro ao carregar LegisMiner.pdf automaticamente: {e}")
         loader = PyPDFLoader(pdf_path)
         documents = loader.load()
+        # ➕ Adiciona também na troca manual o trecho crítico
+        documents.append(Document(page_content=fator_seg_texto, metadata={"source": "manual_injection"}))
         text_splitter = RecursiveCharacterTextSplitter(chunk_size=800, chunk_overlap=300)
         docs = text_splitter.split_documents(documents)
         llm = ChatOpenAI(
             openai_api_key=OPENROUTER_API_KEY,
             openai_api_base="https://openrouter.ai/api/v1",
+            model="meta-llama/llama-3-8b-instruct:free",
+            temperature=0.3
         )
         qa_chain = RetrievalQA.from_chain_type(
         return "⚠️ Por favor, carregue um PDF primeiro", "", {}
     try:
+        # 🎯 Prompt especializado
         system_prompt = (
+            "Você é um Analista Técnico Especialista em Normas Regulatórias de Mineração do Brasil. "
+            "Responda exclusivamente com base no conteúdo do PDF LegisMiner.pdf. "
+            "Explique de forma objetiva, técnica e clara. "
+            "Se a resposta não estiver disponível no documento, informe isso ao usuário."
         )
         resposta = qa_chain.invoke({
         })
         sources = "\n\n".join(
+            [f"📄 Fonte {i+1}:\n{doc.page_content[:500]}..."
              for i, doc in enumerate(resposta['source_documents'])]
         )