Spaces:

caarleexx
/

Age

Sleeping

App Files Files Community

caarleexx commited on Dec 13, 2025

Commit

ee00348

verified ·

1 Parent(s): 3196290

Update backend/main.py

Browse files

Files changed (1) hide show

backend/main.py +10 -11

backend/main.py CHANGED Viewed

@@ -19,10 +19,9 @@ from langchain_community.vectorstores import FAISS
 from langchain_core.runnables import RunnablePassthrough, RunnableLambda
 from langchain_core.output_parsers import StrOutputParser
-# Carrega as API keys do arquivo .env
 load_dotenv()
-# --- 1. Inicialização e Configuração ---
 app = FastAPI()
 app.add_middleware(
@@ -33,12 +32,13 @@ app.add_middleware(
     allow_headers=["*"],
 )
-# --- 2. Configurações de IA Otimizadas (Baseado no app 26) ---
 HF_EMBEDDING_MODEL = "sentence-transformers/all-MiniLM-L6-v2"
-# MUDANÇA 1: Temperatura controlada (0.3 é melhor para fatos/RAG)
 model = ChatGroq(
-    model=os.getenv("GROQ_MODEL", "llama-3.3-70b-versatile"),
     temperature=0.3
 )
@@ -47,7 +47,7 @@ embeddings = HuggingFaceEmbeddings(
     model_kwargs={'device': 'cpu'}
 )
-# MUDANÇA 2: System Prompt Melhorado (Inspirado no app 26)
 rag_system_prompt = (
     "Você é um assistente experiente e prestativo. "
     "Sua tarefa é fornecer respostas detalhadas e ricas em contexto com base nas informações fornecidas. "
@@ -62,7 +62,7 @@ rag_prompt = ChatPromptTemplate.from_messages(
 rag_chain = None
-# --- 3. Pydantic Model ---
 class ChatRequest(BaseModel):
     content: str
@@ -91,16 +91,16 @@ async def upload_document(file: UploadFile = File(...)):
         loader = PyPDFLoader(temp_path)
         docs = loader.load()
-        # MUDANÇA 3: Chunking um pouco maior para pegar mais contexto
         text_splitter = RecursiveCharacterTextSplitter(chunk_size=1200, chunk_overlap=200)
         splits = text_splitter.split_documents(docs)
         vectorstore = FAISS.from_documents(documents=splits, embedding=embeddings)
-        # MUDANÇA 4: k=6 (Recupera mais pedaços para o Llama 3.3 analisar)
         retriever = vectorstore.as_retriever(search_kwargs={"k": 6})
-        # Chain com a correção do lambda (dict input)
         rag_chain = (
             RunnablePassthrough.assign(
                 context=(lambda x: x["input"]) | retriever | format_docs
@@ -110,7 +110,6 @@ async def upload_document(file: UploadFile = File(...)):
             | StrOutputParser()
         )
-        # MUDANÇA 5: Retorno com estatísticas (igual ao app 26)
         return {
             "message": "Processamento concluído!",
             "filename": file.filename,

 from langchain_core.runnables import RunnablePassthrough, RunnableLambda
 from langchain_core.output_parsers import StrOutputParser
 load_dotenv()
+# --- 1. Inicialização ---
 app = FastAPI()
 app.add_middleware(
     allow_headers=["*"],
 )
+# --- 2. Configurações de IA ---
 HF_EMBEDDING_MODEL = "sentence-transformers/all-MiniLM-L6-v2"
+# MUDANÇA CRÍTICA: Removi o os.getenv para ignorar configurações antigas do ambiente
+# e forçar o uso do modelo novo e funcional.
 model = ChatGroq(
+    model="llama-3.3-70b-versatile",
     temperature=0.3
 )
     model_kwargs={'device': 'cpu'}
 )
+# System Prompt Otimizado
 rag_system_prompt = (
     "Você é um assistente experiente e prestativo. "
     "Sua tarefa é fornecer respostas detalhadas e ricas em contexto com base nas informações fornecidas. "
 rag_chain = None
+# --- 3. Modelo de Dados ---
 class ChatRequest(BaseModel):
     content: str
         loader = PyPDFLoader(temp_path)
         docs = loader.load()
+        # Chunking otimizado
         text_splitter = RecursiveCharacterTextSplitter(chunk_size=1200, chunk_overlap=200)
         splits = text_splitter.split_documents(docs)
         vectorstore = FAISS.from_documents(documents=splits, embedding=embeddings)
+        # Recuperação otimizada (k=6)
         retriever = vectorstore.as_retriever(search_kwargs={"k": 6})
+        # Chain
         rag_chain = (
             RunnablePassthrough.assign(
                 context=(lambda x: x["input"]) | retriever | format_docs
             | StrOutputParser()
         )
         return {
             "message": "Processamento concluído!",
             "filename": file.filename,