Spaces:

akra35567
/

akira

Running

App Files Files Community

akra35567 commited on Nov 19, 2025

Commit

4de9ae8

verified ·

1 Parent(s): fa1cc80

Update modules/api.py

Browse files

Files changed (1) hide show

modules/api.py +63 -125

modules/api.py CHANGED Viewed

@@ -1,19 +1,14 @@
-# modules/api.py — V18 FINAL — RESPOSTA GARANTIDA + CHAVE "resposta" CORRIGIDA
 import time
-import re
 import datetime
-from typing import List
 from flask import Blueprint, request, jsonify, make_response
 from loguru import logger
-import requests
 from .contexto import Contexto
 from .database import Database
 from .treinamento import Treinamento
-from .web_search import WebSearch
 import modules.config as config
-# === CACHE ===
 class SimpleTTLCache:
     def __init__(self, ttl_seconds: int = 300):
         self.ttl = ttl_seconds
@@ -36,80 +31,12 @@ class SimpleTTLCache:
             raise KeyError(key)
         return self._store[key][0]
-# === OLLAMA PROVIDER ===
-class OllamaProvider:
-    def __init__(self):
-        self.url = config.OLLAMA_SERVER_URL
-        self.model = config.OLLAMA_MODEL
-        self.session = requests.Session()
-        self.session.headers.update({"Content-Type": "application/json"})
-        logger.info(f"OLLAMA PROVIDER → {self.url}")
-    def generate(self, prompt: str, context_history: List[dict] = []) -> str:
-        payload = {
-            "model": self.model,
-            "prompt": prompt,
-            "stream": False,
-            "options": {
-                "temperature": config.TEMPERATURE,
-                "num_predict": config.MAX_TOKENS,
-                "num_ctx": config.NUM_CTX,
-                "num_thread": 2
-            }
-        }
-        logger.info(f"Enviando para Ollama: {prompt[:100]}...")
-        for tentativa in range(3):
-            try:
-                resp = self.session.post(self.url, json=payload, timeout=90)
-                if resp.status_code == 200:
-                    data = resp.json()
-                    # CORRIGIDO: OLLAMA DEVOLVE "resposta", NÃO "response"
-                    resposta = data.get("resposta", "").strip()
-                    if resposta:
-                        logger.success(f"Resposta Ollama: {resposta[:60]}...")
-                        return resposta
-                    else:
-                        logger.warning(f"Ollama respondeu vazio. JSON recebido: {data}")
-                        return "Epá, tô aqui, puto! Qual é a cena?"
-                else:
-                    logger.warning(f"Ollama erro {resp.status_code}: {resp.text}")
-            except requests.exceptions.Timeout:
-                logger.warning(f"Timeout tentativa {tentativa + 1}/3...")
-                if tentativa < 2:
-                    time.sleep(3)
-            except Exception as e:
-                logger.error(f"Erro Ollama: {e}")
-                if tentativa == 2:
-                    return "Epá, tô off por agora... volta já!"
-        return "Epá, tô off... tenta de novo, kamba!"
-# === LLM MANAGER ===
-class LLMManager:
-    def __init__(self, config_instance):
-        self.ollama = OllamaProvider()
-        self.providers = ['ollama']
-        logger.info("PROVEDOR: Ollama (único)")
-    def generate(self, user_prompt: str, context_history: List[dict] = []) -> str:
-        return self.ollama.generate(user_prompt, context_history)
-# === API ===
 class AkiraAPI:
     def __init__(self, cfg_module):
         self.config = cfg_module
         self.api = Blueprint("akira_api", __name__)
         self.contexto_cache = SimpleTTLCache(ttl_seconds=300)
-        self.providers = LLMManager(self.config)
         self.db = Database(getattr(self.config, 'DB_PATH', 'akira.db'))
-        try:
-            self.web_search = WebSearch()
-            logger.info("WebSearch OK")
-        except:
-            self.web_search = None
         self._setup_routes()
         self._setup_trainer()
@@ -155,23 +82,68 @@ class AkiraAPI:
                     agora = datetime.datetime.now()
                     return jsonify({'resposta': f"São {agora.strftime('%H:%M')} em Luanda, puto."})
-                # CONTEXTO
                 contexto = self._get_user_context(numero)
-                prompt = self._build_prompt(usuario, numero, mensagem, mensagem_citada, contexto)
-                # GERA RESPOSTA
-                resposta = self.providers.generate(prompt, contexto.obter_historico_para_llm())
-                # GARANTE RESPOSTA
-                if not resposta or resposta.strip() == "":
-                    resposta = "Epá, kandando bué! Tô aqui, puto!"
-                logger.success(f"RESPOSTA FINAL → {resposta[:60]}...")
-                # SALVA CONTEXTO
                 contexto.atualizar_contexto(mensagem, resposta)
-                # TREINAMENTO
                 try:
                     trainer = Treinamento(self.db)
                     trainer.registrar_interacao(
@@ -183,12 +155,9 @@ class AkiraAPI:
                         mensagem_original=mensagem_citada
                     )
                 except Exception as e:
-                    logger.warning(f"Erro ao salvar: {e}")
-                # RETORNA JSON
-                resposta_json = {'resposta': resposta}
-                logger.info(f"RETORNANDO JSON: {resposta_json}")
-                return jsonify(resposta_json), 200
             except Exception as e:
                 logger.exception("Erro em /akira")
@@ -203,35 +172,4 @@ class AkiraAPI:
             numero = "anonimo"
         if numero not in self.contexto_cache:
             self.contexto_cache[numero] = Contexto(self.db, usuario=numero)
-            logger.info(f"Novo contexto: {numero}")
-        return self.contexto_cache[numero]
-    def _build_prompt(self, usuario, numero, mensagem, mensagem_citada, contexto):
-    historico = contexto.obter_historico()
-    hist_text = '\n'.join([f"Usuário: {m[0]}\nAkira: {m[1]}" for m in historico[-8:]])
-    now = datetime.datetime.now().strftime('%d/%m %H:%M')
-    prompt = f"""Você é Akira, uma angolana de Luanda, 18 anos, forte e debochada.
-Fala com gírias: epá, puto, kandando, kota, kamba, bué, xingue, mambo.
-Responde em 1-3 frases curtas, sem censura.
-Data/hora: {now}
-Bot: 244952786417
-### Usuário ###
-- Nome: {usuario}
-- Número: {numero}
-"""
-    if historico:
-        prompt += f"### Histórico ###\n{hist_text}\n\n"
-    if mensagem_citada:
-        prompt += f"### Resposta ao reply ###\n{mensagem_citada}\n\n{mensagem}\n\n"
-    else:
-        prompt += f"### Mensagem ###\n{mensagem}\n\n"
-    prompt += "Akira:"
-    return prompt.strip()

+# modules/api.py — V26 — OLLAMA PRINCIPAL + MISTRAL + GEMINI FALLBACK
 import time
 import datetime
+import requests
 from flask import Blueprint, request, jsonify, make_response
 from loguru import logger
 from .contexto import Contexto
 from .database import Database
 from .treinamento import Treinamento
 import modules.config as config
 class SimpleTTLCache:
     def __init__(self, ttl_seconds: int = 300):
         self.ttl = ttl_seconds
             raise KeyError(key)
         return self._store[key][0]
 class AkiraAPI:
     def __init__(self, cfg_module):
         self.config = cfg_module
         self.api = Blueprint("akira_api", __name__)
         self.contexto_cache = SimpleTTLCache(ttl_seconds=300)
         self.db = Database(getattr(self.config, 'DB_PATH', 'akira.db'))
         self._setup_routes()
         self._setup_trainer()
                     agora = datetime.datetime.now()
                     return jsonify({'resposta': f"São {agora.strftime('%H:%M')} em Luanda, puto."})
+                # CONTEXTO LOCAL
                 contexto = self._get_user_context(numero)
+                # === 1. TENTA OLLAMA AUTÔNOMO (PRINCIPAL) ===
+                payload = {
+                    "usuario": usuario,
+                    "numero": numero,
+                    "mensagem": mensagem,
+                    "mensagem_citada": mensagem_citada,
+                    "historico": contexto.obter_historico_para_llm()[-8:],
+                    "data_hora": datetime.datetime.now().strftime('%d/%m %H:%M')
+                }
+                resposta = None
+                try:
+                    resp = requests.post(config.OLLAMA_SERVER_URL, json=payload, timeout=60)
+                    if resp.status_code == 200:
+                        resposta = resp.json().get("resposta", "").strip()
+                        logger.success("Resposta do Ollama (principal)")
+                except Exception as e:
+                    logger.warning(f"Ollama falhou: {e}")
+                # === 2. FALLBACK 1: MISTRAL ===
+                if not resposta:
+                    logger.info("Tentando Mistral como fallback...")
+                    try:
+                        mistral_payload = {
+                            "model": "mistral-large-latest",
+                            "messages": [{"role": "user", "content": f"Fala como angolana debochada: {mensagem}"}]
+                        }
+                        headers = {"Authorization": f"Bearer {os.getenv('MISTRAL_API_KEY')}"}
+                        resp = requests.post("https://api.mistral.ai/v1/chat/completions", json=mistral_payload, headers=headers, timeout=60)
+                        if resp.status_code == 200:
+                            resposta = resp.json()["choices"][0]["message"]["content"].strip()
+                            logger.success("Resposta do Mistral (fallback 1)")
+                    except Exception as e:
+                        logger.warning(f"Mistral falhou: {e}")
+                # === 3. FALLBACK 2: GEMINI ===
+                if not resposta:
+                    logger.info("Tentando Gemini como fallback...")
+                    try:
+                        gemini_payload = {
+                            "contents": [{"parts": [{"text": f"Fala como angolana debochada: {mensagem}"}]}]
+                        }
+                        headers = {"Content-Type": "application/json"}
+                        url = f"https://generativelanguage.googleapis.com/v1beta/models/gemini-1.5-flash:generateContent?key={os.getenv('GEMINI_API_KEY')}"
+                        resp = requests.post(url, json=gemini_payload, headers=headers, timeout=60)
+                        if resp.status_code == 200:
+                            resposta = resp.json()["candidates"][0]["content"]["parts"][0]["text"].strip()
+                            logger.success("Resposta do Gemini (fallback 2)")
+                    except Exception as e:
+                        logger.warning(f"Gemini falhou: {e}")
+                # === RESPOSTA FINAL (SE TODOS FALHAREM) ===
+                if not resposta:
+                    resposta = resposta.replace("Olá", "Epá").replace("como posso ajudar", "kandando bué")
+                else:
+                    resposta = "Epá, tô off... tenta de novo, kamba!"
+                # SALVA E TREINA
                 contexto.atualizar_contexto(mensagem, resposta)
                 try:
                     trainer = Treinamento(self.db)
                     trainer.registrar_interacao(
                         mensagem_original=mensagem_citada
                     )
                 except Exception as e:
+                    logger.warning(f"Erro ao treinar: {e}")
+                return jsonify({'resposta': resposta})
             except Exception as e:
                 logger.exception("Erro em /akira")
             numero = "anonimo"
         if numero not in self.contexto_cache:
             self.contexto_cache[numero] = Contexto(self.db, usuario=numero)
+        return self.contexto_cache[numero]