Spaces:

akra35567
/

OLLAMA

Sleeping

App Files Files Community

akra35567 commited on Nov 13, 2025

Commit

c009ca0

verified ·

1 Parent(s): 64b6655

Update app.py

Browse files

Files changed (1) hide show

app.py +26 -14

app.py CHANGED Viewed

@@ -1,4 +1,4 @@
-# app.py — V22 — PROMPT DINÂMICO COM GÍRIAS + ABREVIÇÕES DO BANCO
 import subprocess
 import time
 import requests
@@ -12,9 +12,14 @@ app = Flask(__name__)
 OLLAMA_URL = "http://localhost:11434"
 db = Database()
 def check_ollama():
-    try: return requests.get(f"{OLLAMA_URL}/api/tags", timeout=10).status_code == 200
-    except: return False
 def start_ollama():
     subprocess.Popen(["ollama", "serve"], stdout=subprocess.DEVNULL, stderr=subprocess.DEVNULL)
@@ -63,42 +68,49 @@ Fala com gírias: {', '.join(girias)}
 Abreviações: {', '.join(abrevs.keys())}
 Tom: {tom}
 Data/hora: {now}
 ### Usuário: {usuario} ({numero}) ###
 {hist_text and f"### Histórico ###\n{hist_text}\n\n"}
 ### Mensagem ###
 {mensagem}
 Akira:"""
-    # === GERA ===
     payload = {
-        "model": "phi3.5:mini-instruct-q4_0",
         "prompt": prompt,
         "stream": False,
-        "options": {"temperature": 0.9, "num_predict": 256}
     }
     try:
         resp = requests.post(f"{OLLAMA_URL}/api/generate", json=payload, timeout=90)
         resposta = resp.json().get("response", "").strip() or "Epá, kandando bué!"
-        # SALVA
         db.salvar_mensagem(usuario, mensagem, resposta, numero)
         novo_hist = ctx["historico"] + [[mensagem, resposta]]
         db.salvar_contexto(numero, novo_hist, girias, tom)
         return jsonify({'resposta': resposta})
     except Exception as e:
-        logger.error(f"Erro: {e}")
         return jsonify({'resposta': 'Epá, tô off... tenta de novo!'}), 500
 if __name__ == "__main__":
-    logger.info("AKIRA V22 — PROMPT DINÂMICO COM BANCO")
     start_ollama()
     for i in range(60):
-        if check_ollama(): break
         time.sleep(2)
     app.run(host="0.0.0.0", port=7860)

+# app.py — V23 — QWEN2.5:0.5B + PROMPT DINÂMICO COM GÍRIAS + ABREVIÇÕES DO BANCO
 import subprocess
 import time
 import requests
 OLLAMA_URL = "http://localhost:11434"
 db = Database()
+# MODELO LEVE, BOM EM PORTUGUÊS, FINE-TUNEÁVEL
+MODEL_NAME = "qwen2.5:0.5b-instruct-q4_0"
 def check_ollama():
+    try:
+        return requests.get(f"{OLLAMA_URL}/api/tags", timeout=10).status_code == 200
+    except:
+        return False
 def start_ollama():
     subprocess.Popen(["ollama", "serve"], stdout=subprocess.DEVNULL, stderr=subprocess.DEVNULL)
 Abreviações: {', '.join(abrevs.keys())}
 Tom: {tom}
 Data/hora: {now}
 ### Usuário: {usuario} ({numero}) ###
 {hist_text and f"### Histórico ###\n{hist_text}\n\n"}
 ### Mensagem ###
 {mensagem}
 Akira:"""
+    # === GERA COM QWEN2.5:0.5B ===
     payload = {
+        "model": MODEL_NAME,
         "prompt": prompt,
         "stream": False,
+        "options": {
+            "temperature": 0.9,
+            "num_predict": 256,
+            "top_k": 40,
+            "top_p": 0.9
+        }
     }
     try:
         resp = requests.post(f"{OLLAMA_URL}/api/generate", json=payload, timeout=90)
         resposta = resp.json().get("response", "").strip() or "Epá, kandando bué!"
+        # SALVA NO BANCO
         db.salvar_mensagem(usuario, mensagem, resposta, numero)
         novo_hist = ctx["historico"] + [[mensagem, resposta]]
         db.salvar_contexto(numero, novo_hist, girias, tom)
         return jsonify({'resposta': resposta})
     except Exception as e:
+        logger.error(f"Erro Ollama: {e}")
         return jsonify({'resposta': 'Epá, tô off... tenta de novo!'}), 500
 if __name__ == "__main__":
+    logger.info(f"AKIRA V23 — RODANDO COM {MODEL_NAME}")
     start_ollama()
     for i in range(60):
+        if check_ollama():
+            logger.info("Ollama pronto!")
+            break
+        logger.info("Aguardando Ollama...")
         time.sleep(2)
+    else:
+        logger.error("Ollama não respondeu após 2min!")
     app.run(host="0.0.0.0", port=7860)