Spaces:

akra35567
/

OLLAMA

Sleeping

App Files Files Community

akra35567 commited on Nov 21, 2025

Commit

2832986

verified ·

1 Parent(s): 4380c35

Update app.py

Browse files

Files changed (1) hide show

app.py +50 -36

app.py CHANGED Viewed

@@ -1,7 +1,7 @@
-# app.py — AKIRA V31 — Gemma2:2b + Fine-tune automático (HF Space otimizado)
 import re
-import json
-import datetime
 import requests
 from flask import Flask, request, jsonify
 from loguru import logger
@@ -11,77 +11,92 @@ from treinamento import Treinamento
 app = Flask(__name__)
-# Ollama URL (HF Space já tem Ollama instalado)
 OLLAMA_URL = "http://localhost:11434"
-db = Database("/app/akira.db")
 treinamento = Treinamento(db, min_interactions=20, interval_hours=3)
-def check_ollama():
-    try:
-        r = requests.get(f"{OLLAMA_URL}/api/tags", timeout=5)
-        return r.status_code == 200
-    except:
-        return False
 @app.route("/")
 def index():
     return '''
     <div style="font-family: monospace; text-align: center; margin: 50px; background: #000; color: #0f0; padding: 40px;">
-        <h1>AKIRA V31 — LUANDA FULL DEBOCHE</h1>
-        <p>POST /api/generate → {"mensagem": "oi kota", "usuario": "Isaac", "numero": "244937..."}</p>
-        <p>Fine-tune automático a cada 20 mensagens</p>
     </div>
     ''', 200
 @app.route("/health")
 def health():
-    return jsonify({"status": "OK" if check_ollama() else "Ollama acordando..."}), 200
 @app.route("/api/generate", methods=["POST"])
 def generate():
-    if not check_ollama():
-        return jsonify({"resposta": "Epá, tô acordando... espera 15 segundos kota!"}), 503
     data = request.get_json() or {}
     mensagem = data.get("mensagem", "").strip()
-    usuario = data.get("usuario", "kota").split()[0]
     numero = data.get("numero", "244999999999")
     if not mensagem:
         return jsonify({"error": "manda a mensagem puto"}), 400
-    # Prompt ULTRA FORÇADO (Gemma2:2b só obedece assim)
     prompt = f"""<start_of_turn>user
 {mensagem}<end_of_turn>
 <start_of_turn>model
-Epá {usuario}, """
     payload = {
-        "model": config.OLLAMA_MODEL,  # muda automaticamente quando fine-tune roda
         "prompt": prompt,
         "stream": False,
         "options": {
             "temperature": 0.9,
-            "num_predict": 180,
-            "top_p": 0.9,
-            "stop": ["<end_of_turn>", "\n\n", "user:", "<|eot_id|>"],
-            "num_ctx": 4096
         }
     }
     try:
-        r = requests.post(f"{OLLAMA_URL}/api/generate", json=payload, timeout=90)
         r.raise_for_status()
         resposta_bruta = r.json().get("response", "").strip()
-        # Limpeza pesada (nunca deixa escapar merda)
-        resposta = re.sub(r'[\*\_\`\[\]\(\)\<\>]', '', resposta_bruta)
         resposta = resposta.split("<end_of_turn>")[0].split("\n")[0].strip()
         resposta = resposta[:280]
-        if not resposta or len(resposta) < 6:
-            resposta = "Epá, tá mbora? kkkkk"
         # Salva e treina
         db.salvar_mensagem(usuario, mensagem, resposta, numero)
@@ -90,10 +105,9 @@ Epá {usuario}, """
         return jsonify({"resposta": resposta})
     except Exception as e:
-        logger.error(f"Ollama erro: {e}")
-        return jsonify({"resposta": "Puto o servidor tá na merda agora, tenta já já."}), 500
 if __name__ == "__main__":
-    logger.info("AKIRA V31 — INICIANDO")
-    app.run(host="0.0.0.0", port=7860)

+# app.py — AKIRA V36 FINAL — ZERO 503 + RESPOSTA RÁPIDA + FINE-TUNE FUNCIONANDO
+import os
 import re
+import time
 import requests
 from flask import Flask, request, jsonify
 from loguru import logger
 app = Flask(__name__)
+# Ollama URL
 OLLAMA_URL = "http://localhost:11434"
+# Instancia DB e treinamento
+db = Database("/app/data/akira.db")  # /app/data pra garantir persistência no HF
 treinamento = Treinamento(db, min_interactions=20, interval_hours=3)
+# FUNÇÃO QUE ESPERA OLLAMA ATÉ ACORDAR (ADEUS 503!)
+def wait_ollama_ready(max_wait=120):
+    logger.info("Akira acordando Ollama... espera aí kota")
+    for i in range(max_wait):
+        try:
+            r = requests.get(f"{OLLAMA_URL}/api/tags", timeout=10)
+            if r.status_code == 200 and "models" in r.text:
+                logger.success("Ollama pronto! Gemma2 carregada e quente!")
+                return True
+        except:
+            pass
+        time.sleep(1)
+    logger.error("Ollama não acordou a tempo...")
+    return False
+# Espera Ollama na inicialização do app
+wait_ollama_ready()
 @app.route("/")
 def index():
     return '''
     <div style="font-family: monospace; text-align: center; margin: 50px; background: #000; color: #0f0; padding: 40px;">
+        <h1>AKIRA V36 — LUANDA FULL DEBOCHE</h1>
+        <h2 style="color:#ff0">POST /api/generate</h2>
+        <p>Responde em < 6s • Sem 503 • Fine-tune automático</p>
+        <p>Bué fixe, Isaac! Manda aí kota 🇦🇴🔥</p>
     </div>
     ''', 200
 @app.route("/health")
 def health():
+    try:
+        requests.get(f"{OLLAMA_URL}/api/tags", timeout=5)
+        return jsonify({"status": "OK", "model": config.OLLAMA_MODEL}), 200
+    except:
+        return jsonify({"status": "Ollama dormindo..."}), 503
 @app.route("/api/generate", methods=["POST"])
 def generate():
     data = request.get_json() or {}
     mensagem = data.get("mensagem", "").strip()
+    usuario = data.get("usuario", "kota")
     numero = data.get("numero", "244999999999")
     if not mensagem:
         return jsonify({"error": "manda a mensagem puto"}), 400
+    logger.info(f"[{usuario} | {numero}] {mensagem[:60]}")
+    # Prompt ultra forçado pra Gemma2:2b obedecer
     prompt = f"""<start_of_turn>user
 {mensagem}<end_of_turn>
 <start_of_turn>model
+Epá {usuario.split(' ', 1)[0] if usuario != 'kota' else 'kota'}, """
     payload = {
+        "model": config.OLLAMA_MODEL,
         "prompt": prompt,
         "stream": False,
         "options": {
             "temperature": 0.9,
+            "num_predict": 200,
+            "top_p": 0.92,
+            "stop": ["<end_of_turn>", "<|eot_id|>", "\nuser:", "\n\n"]
         }
     }
     try:
+        r = requests.post(f"{OLLAMA_URL}/api/generate", json=payload, timeout=60)
         r.raise_for_status()
         resposta_bruta = r.json().get("response", "").strip()
+        # Limpeza pesada
+        resposta = re.sub(r'[\*\_\`\<\>\[\]\(\)\#\@\!\$\%\^\&\+\=]', '', resposta_bruta)
         resposta = resposta.split("<end_of_turn>")[0].split("\n")[0].strip()
         resposta = resposta[:280]
+        if len(resposta) < 8:
+            resposta = "Epá, tá mbora? kkkkkk"
         # Salva e treina
         db.salvar_mensagem(usuario, mensagem, resposta, numero)
         return jsonify({"resposta": resposta})
     except Exception as e:
+        logger.error(f"Erro Ollama: {e}")
+        return jsonify({"resposta": "Epá, hoje o sistema tá na merda total... tenta já já kota!"}), 500
 if __name__ == "__main__":
+    logger.success("AKIRA V36 RODANDO — PRONTA PRA DEBOCHAR")
+    app.run(host="0.0.0.0", port=int(os.environ.get("PORT", 7860)))