Spaces:

caarleexx
/

Age

Sleeping

caarleexx commited on Dec 13, 2025

Commit

3239617

verified ·

1 Parent(s): 0775758

Update backend/main.py

Files changed (1) hide show

backend/main.py CHANGED Viewed

@@ -39,7 +39,8 @@ app.add_middleware(
 HF_EMBEDDING_MODEL = "sentence-transformers/all-MiniLM-L6-v2"
 # Inicializa o modelo Groq
-model = ChatGroq(model=os.getenv("GROQ_MODEL", "mixtral-8x7b-32768"))
 # Inicializa o HuggingFaceEmbeddings na CPU
 embeddings = HuggingFaceEmbeddings(
@@ -109,8 +110,8 @@ async def upload_document(file: UploadFile = File(...)):
         vectorstore = FAISS.from_documents(documents=splits, embedding=embeddings)
         retriever = vectorstore.as_retriever(search_kwargs={"k": 4})
-        # 5. Criar a nova Chain RAG (CORRIGIDO)
-        # O lambda extrai apenas o texto da pergunta ("input") do dicionário que chega
         rag_chain = (
             RunnablePassthrough.assign(
                 context=(lambda x: x["input"]) | retriever | format_docs
@@ -150,7 +151,6 @@ async def chat(request: ChatRequest):
     async def stream_generator():
         try:
             # 'astream' é o método de streaming assíncrono do LangChain
-            # Passamos {"input": ...} que será interceptado pelo lambda definido acima
             async for chunk in current_chain.astream({"input": request.content}):
                 if chunk:
                     yield chunk

 HF_EMBEDDING_MODEL = "sentence-transformers/all-MiniLM-L6-v2"
 # Inicializa o modelo Groq
+# CORREÇÃO AQUI: Atualizado para 'llama-3.3-70b-versatile' pois o mixtral foi descontinuado
+model = ChatGroq(model=os.getenv("GROQ_MODEL", "llama-3.3-70b-versatile"))
 # Inicializa o HuggingFaceEmbeddings na CPU
 embeddings = HuggingFaceEmbeddings(
         vectorstore = FAISS.from_documents(documents=splits, embedding=embeddings)
         retriever = vectorstore.as_retriever(search_kwargs={"k": 4})
+        # 5. Criar a nova Chain RAG
+        # Correção mantida: lambda para extrair 'input' do dicionário
         rag_chain = (
             RunnablePassthrough.assign(
                 context=(lambda x: x["input"]) | retriever | format_docs
     async def stream_generator():
         try:
             # 'astream' é o método de streaming assíncrono do LangChain
             async for chunk in current_chain.astream({"input": request.content}):
                 if chunk:
                     yield chunk