Spaces:

caarleexx
/

Iza

Sleeping

App Files Files Community

caarleexx commited on Dec 13, 2025

Commit

3654c3e

verified ·

1 Parent(s): 9456eeb

Update app.py

Browse files

Files changed (1) hide show

app.py +23 -21

app.py CHANGED Viewed

@@ -2,7 +2,8 @@
 import streamlit as st
 import time
-import os # Importado para manipulação de arquivos temporários
 # --- IMPORTS GROQ ---
 from groq import Groq
@@ -11,7 +12,7 @@ from groq import Groq
 from langchain_community.document_loaders import TextLoader
 from langchain_community.document_loaders import PyPDFLoader
 from langchain_text_splitters import RecursiveCharacterTextSplitter
-from langchain_huggingface import HuggingFaceEmbeddings # Embeddings que rodam na CPU
 from langchain_community.vectorstores import FAISS
 from langchain.chains import RetrievalQA
 from langchain_groq import ChatGroq
@@ -43,7 +44,7 @@ st.markdown("""
     [data-testid="stChatMessage"] {
         padding-left: 0px;
         padding-right: 0px;
-        gap: 0.0rem !important; /* Força a remoção do gap entre o avatar (agora zero) e o texto */
     }
     /* Mantém a justificação do texto e garante a largura total para o conteúdo da mensagem */
@@ -66,19 +67,16 @@ st.markdown("""
 """, unsafe_allow_html=True)
 st.title("Iza - Assistente com Groq RAG 🚀")
-st.caption("Um chatbot com memória, upload de arquivos e controle de velocidade. Integração com LangChain RAG.")
 # 3. Configuração do Cliente Groq
-# Cliente Groq padrão para chamadas com Tool Use
 client = Groq()
-# Cliente Groq para uso dentro do LangChain
 groq_llm = ChatGroq(model_name="mixtral-8x7b-32768", temperature=0.7)
 # 2. Barra Lateral e Lógica de Upload/Processamento RAG
 with st.sidebar:
     st.header("Opções")
-    # Inicializa variáveis de sessão para RAG
     if 'retriever' not in st.session_state:
         st.session_state.retriever = None
         st.session_state.retriever_source = None
@@ -94,16 +92,16 @@ with st.sidebar:
         # Apenas processa se o arquivo for novo
         if st.session_state.retriever_source != uploaded_file.name:
-            file_path = f"./temp_file_{uploaded_file.name.replace('/', '_')}"
             try:
-                # 1. SALVAR/LER ARQUIVO TEMPORARIAMENTE
-                bytes_data = uploaded_file.read()
-                with open(file_path, "wb") as f:
-                    f.write(bytes_data)
                 # 2. CONFIGURAÇÃO RAG (Processo de Embedding)
-                with st.spinner(f"Processando '{uploaded_file.name}' com LangChain e HuggingFace Embeddings (CPU)..."):
                     # Carregamento do Documento
                     if uploaded_file.type == 'application/pdf':
@@ -114,11 +112,17 @@ with st.sidebar:
                         raise ValueError("Tipo de arquivo não suportado após o upload.")
                     documents = loader.load()
                     text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=200)
                     texts = text_splitter.split_documents(documents)
                     # HuggingFace Embeddings (Roda na CPU)
                     embeddings = HuggingFaceEmbeddings(model_name="all-MiniLM-L6-v2")
                     vectorstore = FAISS.from_documents(texts, embeddings)
                     # Armazenar na sessão
@@ -129,9 +133,9 @@ with st.sidebar:
             except Exception as e:
                 # Tratamento de erro 403 e outros
                 if "403" in str(e):
-                    st.error("Erro no upload (403 Forbidden). O servidor está rejeitando a requisição. Tente com um arquivo menor ou execute localmente.")
                 else:
-                    st.error(f"Erro ao processar o arquivo com LangChain: {e}")
                 st.session_state.retriever = None
                 st.session_state.retriever_source = None
@@ -141,11 +145,9 @@ with st.sidebar:
                     os.remove(file_path)
         else:
-             # Se o arquivo já foi processado
              st.info(f"O arquivo '{st.session_state.retriever_source}' já foi processado e está ativo.")
     elif st.session_state.retriever_source is not None:
-         # Limpa se o uploader foi esvaziado, mas o retriever estava ativo
          st.warning("O arquivo processado foi removido. A IA voltará a usar pesquisa web.")
          st.session_state.retriever = None
          st.session_state.retriever_source = None
@@ -191,7 +193,7 @@ if prompt := st.chat_input("Pergunte algo sobre o documento ou faça uma pesquis
                     return_source_documents=False
                 )
-                # OBS: A resposta RAG vem completa (sem streaming simples)
                 with st.spinner("Buscando no documento e gerando resposta..."):
                     result = qa_chain.invoke({"query": prompt})
                     full_response = result['result']
@@ -199,7 +201,7 @@ if prompt := st.chat_input("Pergunte algo sobre o documento ou faça uma pesquis
             else:
                 # GROQ DIRETO: Caso NÃO haja arquivo (usa Tool Use para pesquisa web).
                 stream = client.chat.completions.create(
-                    model="groq/compound", # Modelo com Compound para Tool Use
                     messages=[
                         {"role": m["role"], "content": m["content"]}
                         for m in st.session_state.messages
@@ -216,7 +218,7 @@ if prompt := st.chat_input("Pergunte algo sobre o documento ou faça uma pesquis
                     placeholder.markdown(full_response + "▌")
                     time.sleep(0.005)
-            # Exibe a resposta completa (do RAG ou do Streaming)
             placeholder.markdown(full_response)
             # 6c. Adiciona a resposta completa ao histórico

 import streamlit as st
 import time
+import os
+import tempfile # <--- NOVO: Para criar diretórios temporários seguros
 # --- IMPORTS GROQ ---
 from groq import Groq
 from langchain_community.document_loaders import TextLoader
 from langchain_community.document_loaders import PyPDFLoader
 from langchain_text_splitters import RecursiveCharacterTextSplitter
+from langchain_huggingface import HuggingFaceEmbeddings
 from langchain_community.vectorstores import FAISS
 from langchain.chains import RetrievalQA
 from langchain_groq import ChatGroq
     [data-testid="stChatMessage"] {
         padding-left: 0px;
         padding-right: 0px;
+        gap: 0.0rem !important;
     }
     /* Mantém a justificação do texto e garante a largura total para o conteúdo da mensagem */
 """, unsafe_allow_html=True)
 st.title("Iza - Assistente com Groq RAG 🚀")
+st.caption("Um chatbot com memória, upload de arquivos, LangChain RAG e controle de velocidade.")
 # 3. Configuração do Cliente Groq
 client = Groq()
 groq_llm = ChatGroq(model_name="mixtral-8x7b-32768", temperature=0.7)
 # 2. Barra Lateral e Lógica de Upload/Processamento RAG
 with st.sidebar:
     st.header("Opções")
     if 'retriever' not in st.session_state:
         st.session_state.retriever = None
         st.session_state.retriever_source = None
         # Apenas processa se o arquivo for novo
         if st.session_state.retriever_source != uploaded_file.name:
+            # --- USO DO DIRETÓRIO TEMPORÁRIO ---
+            with tempfile.NamedTemporaryFile(delete=False, suffix=f"_{uploaded_file.name}") as tmp_file:
+                tmp_file.write(uploaded_file.read())
+                file_path = tmp_file.name
             try:
                 # 2. CONFIGURAÇÃO RAG (Processo de Embedding)
+                with st.spinner(f"Processando '{uploaded_file.name}' com LangChain..."):
+                    st.info("Passo 1/4: Salvando arquivo temporariamente.")
                     # Carregamento do Documento
                     if uploaded_file.type == 'application/pdf':
                         raise ValueError("Tipo de arquivo não suportado após o upload.")
                     documents = loader.load()
+                    st.info("Passo 2/4: Fragmentando o texto do documento.")
                     text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=200)
                     texts = text_splitter.split_documents(documents)
                     # HuggingFace Embeddings (Roda na CPU)
+                    st.info("Passo 3/4: Criando Embeddings (vetores) com HuggingFace.")
                     embeddings = HuggingFaceEmbeddings(model_name="all-MiniLM-L6-v2")
+                    # Criar o Vector Store (FAISS)
+                    st.info("Passo 4/4: Criando o Vector Store (FAISS) para busca rápida.")
                     vectorstore = FAISS.from_documents(texts, embeddings)
                     # Armazenar na sessão
             except Exception as e:
                 # Tratamento de erro 403 e outros
                 if "403" in str(e):
+                    st.error("Erro no upload (403 Forbidden). O servidor de deploy está rejeitando a requisição.")
                 else:
+                    st.error(f"Erro ao processar o arquivo: {e}")
                 st.session_state.retriever = None
                 st.session_state.retriever_source = None
                     os.remove(file_path)
         else:
              st.info(f"O arquivo '{st.session_state.retriever_source}' já foi processado e está ativo.")
     elif st.session_state.retriever_source is not None:
          st.warning("O arquivo processado foi removido. A IA voltará a usar pesquisa web.")
          st.session_state.retriever = None
          st.session_state.retriever_source = None
                     return_source_documents=False
                 )
+                # Resposta RAG
                 with st.spinner("Buscando no documento e gerando resposta..."):
                     result = qa_chain.invoke({"query": prompt})
                     full_response = result['result']
             else:
                 # GROQ DIRETO: Caso NÃO haja arquivo (usa Tool Use para pesquisa web).
                 stream = client.chat.completions.create(
+                    model="groq/compound",
                     messages=[
                         {"role": m["role"], "content": m["content"]}
                         for m in st.session_state.messages
                     placeholder.markdown(full_response + "▌")
                     time.sleep(0.005)
+            # Exibe a resposta completa
             placeholder.markdown(full_response)
             # 6c. Adiciona a resposta completa ao histórico