Spaces:

akra35567
/

OLLAMA

Sleeping

App Files Files Community

akra35567 commited on Nov 21, 2025

Commit

5c8d8f1

verified ·

1 Parent(s): 2be1180

Update app.py

Browse files

Files changed (1) hide show

app.py +67 -44

app.py CHANGED Viewed

@@ -1,76 +1,99 @@
-# app.py — AKIRA V38 — FUNCIONA 100% NO TEU SPACE AGORA MESMO
-import os
 import re
-import time
 import requests
 from flask import Flask, request, jsonify
 from loguru import logger
 app = Flask(__name__)
 OLLAMA_URL = "http://localhost:11434"
-# MODELO GARANTIDO — usa o fine-tunado se existir, senão o base
-def get_model():
     try:
         r = requests.get(f"{OLLAMA_URL}/api/tags", timeout=5)
-        models = [m["name"] for m in r.json()["models"]]
-        if "akira-luanda" in " ".join(models):
-            return "akira-luanda:latest"  # teu fine-tune
-        return "gemma2:2b-instruct-q4_0"
     except:
-        return "gemma2:2b-instruct-q4_0"  # fallback seguro
-# Espera Ollama acordar
-def wait_ollama():
-    logger.info("Akira acordando Ollama...")
-    for _ in range(90):
-        try:
-            r = requests.get(f"{OLLAMA_URL}/api/tags", timeout=5)
-            if r.status_code == 200:
-                logger.success(f"Ollama pronto! Modelo: {get_model()}")
-                return
-        except:
-            time.sleep(1)
-    logger.warning("Ollama demorou, mas vamos tentar mesmo assim...")
-wait_ollama()
 @app.route("/")
-def home():
-    return "<h1 style='color:#0f0;text-align:center;margin-top:100px'>AKIRA V38 ONLINE — POST /api/generate</h1>", 200
 @app.route("/api/generate", methods=["POST"])
 def generate():
     data = request.get_json() or {}
     mensagem = data.get("mensagem", "").strip()
     usuario = data.get("usuario", "kota").split()[0]
     if not mensagem:
-        return jsonify({"error": "manda mensagem kota"}), 400
-    prompt = f"<start_of_turn>user\n{mensagem}<end_of_turn>\n<start_of_turn>model\nEpá {usuario}, "
     try:
-        r = requests.post(f"{OLLAMA_URL}/api/generate", json={
-            "model": get_model(),
-            "prompt": prompt,
-            "stream": False,
-            "options": {
-                "temperature": 0.9,
-                "num_predict": 200,
-                "stop": ["<end_of_turn>"]
-            }
-        }, timeout=60)
-        resposta = r.json().get("response", "Bué fixe kota kkkkk").strip()
-        resposta = re.sub(r'[\*\_`<>[\]()#]', '', resposta)[:280]
         return jsonify({"resposta": resposta})
     except Exception as e:
-        logger.error(f"Erro: {e}")
-        return jsonify({"resposta": "Epá, Ollama tá de pau hoje... tenta daqui a pouco kota!"})
 if __name__ == "__main__":
     app.run(host="0.0.0.0", port=7860)

+# app.py — AKIRA V31 — Gemma2:2b + Fine-tune automático (HF Space otimizado)
 import re
+import json
+import datetime
 import requests
 from flask import Flask, request, jsonify
 from loguru import logger
+import config
+from database import Database
+from treinamento import Treinamento
 app = Flask(__name__)
+# Ollama URL (HF Space já tem Ollama instalado)
 OLLAMA_URL = "http://localhost:11434"
+db = Database("/app/akira.db")
+treinamento = Treinamento(db, min_interactions=20, interval_hours=3)
+def check_ollama():
     try:
         r = requests.get(f"{OLLAMA_URL}/api/tags", timeout=5)
+        return r.status_code == 200
     except:
+        return False
 @app.route("/")
+def index():
+    return '''
+    <div style="font-family: monospace; text-align: center; margin: 50px; background: #000; color: #0f0; padding: 40px;">
+        <h1>AKIRA V31 — LUANDA FULL DEBOCHE</h1>
+        <p>POST /api/generate → {"mensagem": "oi kota", "usuario": "Isaac", "numero": "244937..."}</p>
+        <p>Fine-tune automático a cada 20 mensagens</p>
+    </div>
+    ''', 200
+@app.route("/health")
+def health():
+    return jsonify({"status": "OK" if check_ollama() else "Ollama acordando..."}), 200
 @app.route("/api/generate", methods=["POST"])
 def generate():
+    if not check_ollama():
+        return jsonify({"resposta": "Epá, tô acordando... espera 15 segundos kota!"}), 503
     data = request.get_json() or {}
     mensagem = data.get("mensagem", "").strip()
     usuario = data.get("usuario", "kota").split()[0]
+    numero = data.get("numero", "244999999999")
     if not mensagem:
+        return jsonify({"error": "manda a mensagem puto"}), 400
+    # Prompt ULTRA FORÇADO (Gemma2:2b só obedece assim)
+    prompt = f"""<start_of_turn>user
+{mensagem}<end_of_turn>
+<start_of_turn>model
+Epá {usuario}, """
+    payload = {
+        "model": config.OLLAMA_MODEL,  # muda automaticamente quando fine-tune roda
+        "prompt": prompt,
+        "stream": False,
+        "options": {
+            "temperature": 0.9,
+            "num_predict": 180,
+            "top_p": 0.9,
+            "stop": ["<end_of_turn>", "\n\n", "user:", "<|eot_id|>"],
+            "num_ctx": 4096
+        }
+    }
     try:
+        r = requests.post(f"{OLLAMA_URL}/api/generate", json=payload, timeout=90)
+        r.raise_for_status()
+        resposta_bruta = r.json().get("response", "").strip()
+        # Limpeza pesada (nunca deixa escapar merda)
+        resposta = re.sub(r'[\*\_\`\[\]\(\)\<\>]', '', resposta_bruta)
+        resposta = resposta.split("<end_of_turn>")[0].split("\n")[0].strip()
+        resposta = resposta[:280]
+        if not resposta or len(resposta) < 6:
+            resposta = "Epá, tá mbora? kkkkk"
+        # Salva e treina
+        db.salvar_mensagem(usuario, mensagem, resposta, numero)
+        treinamento.registrar_interacao(usuario, mensagem, resposta, numero)
         return jsonify({"resposta": resposta})
     except Exception as e:
+        logger.error(f"Ollama erro: {e}")
+        return jsonify({"resposta": "Puto o servidor tá na merda agora, tenta já já."}), 500
 if __name__ == "__main__":
+    logger.info("AKIRA V31 — INICIANDO")
     app.run(host="0.0.0.0", port=7860)