Spaces:

akra35567
/

OLLAMA

Sleeping

App Files Files Community

akra35567 commited on Nov 13, 2025

Commit

f3b7acc

verified ·

1 Parent(s): e316740

Update app.py

Browse files

Files changed (1) hide show

app.py +49 -33

app.py CHANGED Viewed

@@ -1,15 +1,10 @@
-# app.py — OLLAMA SERVER (HF SPACE) — V18 FINAL
-"""
-AKIRA V18 — OLLAMA SERVER
-- Recebe: prompt, numero, usuario, mensagem, mensagem_citada, historico
-- Envia prompt completo para Ollama
-- Responde com {"resposta": "..."}
-"""
 import subprocess
 import time
 import requests
 import sys
 import os
 from flask import Flask, request, jsonify
 from loguru import logger
@@ -38,7 +33,7 @@ def wait_for_ollama():
     logger.info("Aguardando Ollama (11434)...")
     for i in range(60):
         if check_ollama():
-            logger.success("Ollama PRONTO! qwen2.5:3b-instruct-q4_0")
             return True
         time.sleep(2)
     logger.critical("Ollama não subiu!")
@@ -49,9 +44,9 @@ def wait_for_ollama():
 def index():
     return '''
     <div style="font-family: monospace; text-align: center; margin: 50px; background: #000; color: #0f0; padding: 40px;">
-        <h1>AKIRA V18 OLLAMA SERVER</h1>
-        <p><strong>qwen2.5:3b-instruct-q4_0</strong></p>
-        <p><strong>Recebe: prompt, numero, mensagem, mensagem_citada, historico</strong></p>
         <p><code>POST /api/generate</code></p>
         <p>Health: <a href="/health">/health</a></p>
     </div>
@@ -61,37 +56,54 @@ def index():
 def health():
     return jsonify({"status": "OK" if check_ollama() else "INICIANDO..."}), 200
-# === ROTA PRINCIPAL: /api/generate ===
 @app.route("/api/generate", methods=['POST'])
 def generate():
     if not check_ollama():
         return jsonify({'resposta': 'Epá, tô acordando... espera 10s!'}), 503
     data = request.get_json() or {}
-    # === RECEBE TUDO QUE O api.py ENVIA ===
-    prompt = data.get('prompt', '').strip()
-    numero = data.get('numero', '')
-    usuario = data.get('usuario', 'anonimo')
     mensagem = data.get('mensagem', '').strip()
     mensagem_citada = data.get('mensagem_citada', '').strip()
-    historico = data.get('historico', [])
-    if not prompt:
-        return jsonify({'error': 'prompt obrigatório'}), 400
-    # === LOG COMPLETO ===
-    logger.info(f"Recebido de {usuario} ({numero})")
-    logger.info(f"Mensagem: {mensagem[:60]}")
     if mensagem_citada:
-        logger.info(f"Reply: {mensagem_citada[:60]}")
-    logger.info(f"Histórico: {len(historico)} mensagens")
-    logger.info(f"Prompt: {prompt[:120]}...")
-    # === ENVIA PROMPT GIGANTE PARA OLLAMA ===
     payload = {
-        "model": "qwen2.5:3b-instruct-q4_0",
-        "prompt": prompt,
         "stream": False,
         "options": {
             "temperature": 0.9,
@@ -102,14 +114,16 @@ def generate():
     }
     try:
-        resp = requests.post(f"{OLLAMA_URL}/api/generate", json=payload, timeout=120)
         if resp.status_code == 200:
             resposta = resp.json().get("response", "").strip()
             if resposta:
                 logger.success(f"Resposta: {resposta[:60]}...")
                 return jsonify({'resposta': resposta})
             else:
-                return jsonify({'resposta': 'Epá, fiquei sem palavras... manda de novo!'})
         else:
             logger.warning(f"Ollama erro {resp.status_code}: {resp.text}")
             return jsonify({'resposta': 'Epá, tô com problema... tenta de novo!'}), 500
@@ -121,19 +135,21 @@ def generate():
 if __name__ == "__main__":
     logger.remove()
     logger.add(sys.stderr, format="<green>{time:HH:mm:ss}</green> → <level>{message}</level>")
-    logger.info("AKIRA V18 — OLLAMA SERVER INICIANDO...")
     start_ollama()
     if not wait_for_ollama():
         sys.exit(1)
     logger.info("Warming up...")
     try:
         requests.post(f"{OLLAMA_URL}/api/generate", json={
-            "model": "qwen2.5:3b-instruct-q4_0",
             "prompt": "Oi",
             "options": {"num_predict": 1}
         }, timeout=60)
         logger.success("Akira aquecida!")
     except:
         pass
     logger.info("Flask na porta 7860")
     app.run(host="0.0.0.0", port=7860, debug=False)

+# app.py — OLLAMA V19 AUTÔNOMO (PHI3.5-MINI) — DOCKER + PROMPT LIMPO
 import subprocess
 import time
 import requests
 import sys
 import os
+import datetime
 from flask import Flask, request, jsonify
 from loguru import logger
     logger.info("Aguardando Ollama (11434)...")
     for i in range(60):
         if check_ollama():
+            logger.success("Ollama PRONTO! phi3.5:mini-instruct-q4_0")
             return True
         time.sleep(2)
     logger.critical("Ollama não subiu!")
 def index():
     return '''
     <div style="font-family: monospace; text-align: center; margin: 50px; background: #000; color: #0f0; padding: 40px;">
+        <h1>AKIRA V19 OLLAMA SERVER</h1>
+        <p><strong>phi3.5:mini-instruct-q4_0</strong></p>
+        <p><strong>Recebe: mensagem, historico, usuario, numero</strong></p>
         <p><code>POST /api/generate</code></p>
         <p>Health: <a href="/health">/health</a></p>
     </div>
 def health():
     return jsonify({"status": "OK" if check_ollama() else "INICIANDO..."}), 200
+# === ROTA PRINCIPAL ===
 @app.route("/api/generate", methods=['POST'])
 def generate():
     if not check_ollama():
         return jsonify({'resposta': 'Epá, tô acordando... espera 10s!'}), 503
     data = request.get_json() or {}
     mensagem = data.get('mensagem', '').strip()
+    historico = data.get('historico', [])[-8:]  # últimos 8
+    usuario = data.get('usuario', 'anonimo')
+    numero = data.get('numero', '')
     mensagem_citada = data.get('mensagem_citada', '').strip()
+    if not mensagem and not mensagem_citada:
+        return jsonify({'error': 'mensagem obrigatória'}), 400
+    logger.info(f"Recebido de {usuario} ({numero}) → {mensagem[:60]}")
+    # === PROMPT LIMPO (AKIRA STYLE) ===
+    now = datetime.datetime.now().strftime('%d/%m %H:%M')
+    hist_text = '\n'.join([f"Usuário: {h[0]}\nAkira: {h[1]}" for h in historico])
+    prompt = f"""Você é Akira, uma angolana de Luanda, 18 anos, forte e debochada.
+Fala com gírias: epá, puto, kandando, kota, kamba, bué, xingue, mambo.
+Responde em 1-3 frases curtas, sem censura.
+Data/hora: {now}
+Bot: 244952786417
+### Usuário ###
+- Nome: {usuario}
+- Número: {numero}
+"""
+    if historico:
+        prompt += f"### Histórico ###\n{hist_text}\n\n"
     if mensagem_citada:
+        prompt += f"### Resposta ao reply ###\n{mensagem_citada}\n\n{mensagem}\n\n"
+    else:
+        prompt += f"### Mensagem ###\n{mensagem}\n\n"
+    prompt += "Akira:"
+    # === ENVIA PARA OLLAMA (PHI3.5-MINI) ===
     payload = {
+        "model": "phi3.5:mini-instruct-q4_0",
+        "prompt": prompt.strip(),
         "stream": False,
         "options": {
             "temperature": 0.9,
     }
     try:
+        resp = requests.post(f"{OLLAMA_URL}/api/generate", json=payload, timeout=90)
         if resp.status_code == 200:
             resposta = resp.json().get("response", "").strip()
             if resposta:
                 logger.success(f"Resposta: {resposta[:60]}...")
                 return jsonify({'resposta': resposta})
             else:
+                fallback = "Epá, kandando bué! Tô aqui, puto!"
+                logger.warning("Ollama vazio → fallback")
+                return jsonify({'resposta': fallback})
         else:
             logger.warning(f"Ollama erro {resp.status_code}: {resp.text}")
             return jsonify({'resposta': 'Epá, tô com problema... tenta de novo!'}), 500
 if __name__ == "__main__":
     logger.remove()
     logger.add(sys.stderr, format="<green>{time:HH:mm:ss}</green> → <level>{message}</level>")
+    logger.info("AKIRA V19 — OLLAMA SERVER (PHI3.5-MINI) INICIANDO...")
     start_ollama()
     if not wait_for_ollama():
         sys.exit(1)
     logger.info("Warming up...")
     try:
         requests.post(f"{OLLAMA_URL}/api/generate", json={
+            "model": "phi3.5:mini-instruct-q4_0",
             "prompt": "Oi",
             "options": {"num_predict": 1}
         }, timeout=60)
         logger.success("Akira aquecida!")
     except:
         pass
     logger.info("Flask na porta 7860")
     app.run(host="0.0.0.0", port=7860, debug=False)