Spaces:

caarleexx
/

Age

Sleeping

App Files Files Community

caarleexx commited on Dec 13, 2025

Commit

3196290

verified ·

1 Parent(s): 5d7e5a4

Update backend/main.py

Browse files

Files changed (1) hide show

backend/main.py +34 -49

backend/main.py CHANGED Viewed

@@ -25,7 +25,6 @@ load_dotenv()
 # --- 1. Inicialização e Configuração ---
 app = FastAPI()
-# Configuração do CORS
 app.add_middleware(
     CORSMiddleware,
     allow_origins=["*"],
@@ -34,84 +33,74 @@ app.add_middleware(
     allow_headers=["*"],
 )
-# --- 2. Variáveis Globais para RAG ---
-# Define o modelo de embedding do Hugging Face (leve para CPU)
 HF_EMBEDDING_MODEL = "sentence-transformers/all-MiniLM-L6-v2"
-# Inicializa o modelo Groq
-# CORREÇÃO AQUI: Atualizado para 'llama-3.3-70b-versatile' pois o mixtral foi descontinuado
-model = ChatGroq(model=os.getenv("GROQ_MODEL", "llama-3.3-70b-versatile"))
-# Inicializa o HuggingFaceEmbeddings na CPU
 embeddings = HuggingFaceEmbeddings(
     model_name=HF_EMBEDDING_MODEL,
     model_kwargs={'device': 'cpu'}
 )
-# Prompt RAG modificado para receber contexto
 rag_system_prompt = (
-    "Você é um assistente de pesquisa avançado. "
-    "Use o CONTEXTO fornecido para responder à pergunta do usuário. "
-    "Responda de forma completa e detalhada, citando o contexto sempre que possível. "
-    "Se o contexto não for suficiente, diga que não tem informações suficientes."
-    "\n\nCONTEXTO: {context}"
 )
 rag_prompt = ChatPromptTemplate.from_messages(
     [("system", rag_system_prompt), ("human", "{input}")]
 )
-# A chain será inicializada com o endpoint de upload
 rag_chain = None
 # --- 3. Pydantic Model ---
 class ChatRequest(BaseModel):
     content: str
-# --- 4. Funções de RAG (Helper Functions) ---
 def format_docs(docs):
-    """Formata os documentos recuperados em uma string única para injeção no prompt."""
     return "\n\n---\n\n".join(
-        f"Conteúdo: {doc.page_content}\n(Fonte: Página {doc.metadata.get('page', 'N/A')})"
         for doc in docs
     )
-# --- 5. Endpoints da API ---
 @app.post("/upload-document")
 async def upload_document(file: UploadFile = File(...)):
-    """
-    Este endpoint recebe um arquivo, processa-o e inicializa o vetorstore e o retriever.
-    """
     global rag_chain
     if file.content_type != "application/pdf":
-        raise HTTPException(status_code=400, detail="Apenas arquivos PDF são suportados neste exemplo.")
-    # 1. Salvar o arquivo temporariamente para o Loader poder ler
     try:
         with tempfile.NamedTemporaryFile(delete=False, suffix=".pdf") as tmp_file:
             content = await file.read()
             tmp_file.write(content)
             temp_path = tmp_file.name
-        # 2. Carregar o documento
         loader = PyPDFLoader(temp_path)
         docs = loader.load()
-        # 3. Particionar (Chunking)
-        text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=200)
         splits = text_splitter.split_documents(docs)
-        # 4. Vetorizar e Armazenar (Vector Store)
         vectorstore = FAISS.from_documents(documents=splits, embedding=embeddings)
-        retriever = vectorstore.as_retriever(search_kwargs={"k": 4})
-        # 5. Criar a nova Chain RAG
-        # Correção mantida: lambda para extrair 'input' do dicionário
         rag_chain = (
             RunnablePassthrough.assign(
                 context=(lambda x: x["input"]) | retriever | format_docs
@@ -121,44 +110,40 @@ async def upload_document(file: UploadFile = File(...)):
             | StrOutputParser()
         )
-        return {"message": f"Documento '{file.filename}' processado e RAG pronto!"}
     except Exception as e:
-        print(f"Erro no processamento do arquivo: {e}")
-        # Retorna um erro 500 para o frontend
-        raise HTTPException(status_code=500, detail=f"Falha ao processar o arquivo: {e}")
     finally:
-        # Limpeza: deletar o arquivo temporário
         if 'temp_path' in locals() and os.path.exists(temp_path):
             os.remove(temp_path)
 @app.post("/chat")
 async def chat(request: ChatRequest):
-    """
-    Endpoint de chat que usa o RAG (se inicializado) ou o modelo base.
-    """
     current_chain = rag_chain
     if current_chain is None:
-         # Fallback para a chain original (apenas prompt/sem contexto)
         base_prompt = ChatPromptTemplate.from_messages(
-            [("system", "Você é um assistente prestativo. Nenhuma informação de documento foi fornecida."), ("human", "{input}")]
         )
         current_chain = base_prompt | model | StrOutputParser()
-    # Função geradora que produz os pedaços (chunks) da resposta
     async def stream_generator():
         try:
-            # 'astream' é o método de streaming assíncrono do LangChain
             async for chunk in current_chain.astream({"input": request.content}):
                 if chunk:
                     yield chunk
         except Exception as e:
-             print(f"Erro no streaming: {e}")
              yield f"Erro no serviço de IA: {e}"
-    # Retorna uma resposta de streaming
     return StreamingResponse(stream_generator(), media_type="text/plain")
 #--- END OF FILE main (1).py ---

 # --- 1. Inicialização e Configuração ---
 app = FastAPI()
 app.add_middleware(
     CORSMiddleware,
     allow_origins=["*"],
     allow_headers=["*"],
 )
+# --- 2. Configurações de IA Otimizadas (Baseado no app 26) ---
 HF_EMBEDDING_MODEL = "sentence-transformers/all-MiniLM-L6-v2"
+# MUDANÇA 1: Temperatura controlada (0.3 é melhor para fatos/RAG)
+model = ChatGroq(
+    model=os.getenv("GROQ_MODEL", "llama-3.3-70b-versatile"),
+    temperature=0.3
+)
 embeddings = HuggingFaceEmbeddings(
     model_name=HF_EMBEDDING_MODEL,
     model_kwargs={'device': 'cpu'}
 )
+# MUDANÇA 2: System Prompt Melhorado (Inspirado no app 26)
 rag_system_prompt = (
+    "Você é um assistente experiente e prestativo. "
+    "Sua tarefa é fornecer respostas detalhadas e ricas em contexto com base nas informações fornecidas. "
+    "Ao usar o contexto abaixo, sintetize os pontos principais e explique como eles se relacionam. "
+    "Se a resposta não estiver no contexto, diga honestamente que não sabe, não invente informações."
+    "\n\nCONTEXTO DO DOCUMENTO:\n{context}"
 )
 rag_prompt = ChatPromptTemplate.from_messages(
     [("system", rag_system_prompt), ("human", "{input}")]
 )
 rag_chain = None
 # --- 3. Pydantic Model ---
 class ChatRequest(BaseModel):
     content: str
+# --- 4. Helpers ---
 def format_docs(docs):
     return "\n\n---\n\n".join(
+        f"Conteúdo: {doc.page_content}\n(Página {doc.metadata.get('page', 'N/A')})"
         for doc in docs
     )
+# --- 5. Endpoints ---
 @app.post("/upload-document")
 async def upload_document(file: UploadFile = File(...)):
     global rag_chain
     if file.content_type != "application/pdf":
+        raise HTTPException(status_code=400, detail="Apenas arquivos PDF são suportados.")
     try:
         with tempfile.NamedTemporaryFile(delete=False, suffix=".pdf") as tmp_file:
             content = await file.read()
             tmp_file.write(content)
             temp_path = tmp_file.name
         loader = PyPDFLoader(temp_path)
         docs = loader.load()
+        # MUDANÇA 3: Chunking um pouco maior para pegar mais contexto
+        text_splitter = RecursiveCharacterTextSplitter(chunk_size=1200, chunk_overlap=200)
         splits = text_splitter.split_documents(docs)
         vectorstore = FAISS.from_documents(documents=splits, embedding=embeddings)
+        # MUDANÇA 4: k=6 (Recupera mais pedaços para o Llama 3.3 analisar)
+        retriever = vectorstore.as_retriever(search_kwargs={"k": 6})
+        # Chain com a correção do lambda (dict input)
         rag_chain = (
             RunnablePassthrough.assign(
                 context=(lambda x: x["input"]) | retriever | format_docs
             | StrOutputParser()
         )
+        # MUDANÇA 5: Retorno com estatísticas (igual ao app 26)
+        return {
+            "message": "Processamento concluído!",
+            "filename": file.filename,
+            "total_pages": len(docs),
+            "total_chunks": len(splits)
+        }
     except Exception as e:
+        print(f"Erro: {e}")
+        raise HTTPException(status_code=500, detail=f"Falha ao processar: {e}")
     finally:
         if 'temp_path' in locals() and os.path.exists(temp_path):
             os.remove(temp_path)
 @app.post("/chat")
 async def chat(request: ChatRequest):
     current_chain = rag_chain
     if current_chain is None:
         base_prompt = ChatPromptTemplate.from_messages(
+            [("system", "Você é um assistente útil. Nenhum documento foi carregado ainda."), ("human", "{input}")]
         )
         current_chain = base_prompt | model | StrOutputParser()
     async def stream_generator():
         try:
             async for chunk in current_chain.astream({"input": request.content}):
                 if chunk:
                     yield chunk
         except Exception as e:
+             print(f"Erro stream: {e}")
              yield f"Erro no serviço de IA: {e}"
     return StreamingResponse(stream_generator(), media_type="text/plain")
 #--- END OF FILE main (1).py ---