Spaces:

GoshawkVortexAI
/

Astrollm

Runtime error

GoshawkVortexAI commited on Feb 19

Commit

576bbd4

verified ·

1 Parent(s): b0812b9

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

+# app.py
+import gradio as gr
+import gdown
+import os
+from pathlib import Path
+import subprocess
+# Model linki (Drive paylaşılan)
+DRIVE_LINK = "https://drive.google.com/uc?id=1OlQWjcevXx-Zw0XXGXK4qyWYW2GP7IaB"
+MODEL_PATH = "ggml-alpaca-7b-q4.bin"
+# Modeli indir (eğer yoksa)
+if not Path(MODEL_PATH).exists():
+    print("Model indiriliyor...")
+    gdown.download(DRIVE_LINK, MODEL_PATH, quiet=False)
+else:
+    print("Model zaten mevcut.")
+# CPU için llama.cpp ile çalıştırma fonksiyonu
+def generate(prompt):
+    # llama.cpp'nin ana binary'si 'main' olarak varsayılıyor
+    # Eğer farklıysa yolu güncelle
+    cmd = [
+        "./main",  # llama.cpp binary
+        "-m", MODEL_PATH,
+        "-p", prompt,
+        "-n", "128",    # max token
+        "-t", "4"       # CPU thread sayısı (düzenle)
+    ]
+    try:
+        result = subprocess.run(cmd, capture_output=True, text=True)
+        output = result.stdout
+        return output
+    except Exception as e:
+        return f"Hata: {e}"
+# Gradio arayüzü
+iface = gr.Interface(
+    fn=generate,
+    inputs=gr.Textbox(lines=3, placeholder="Prompt yaz..."),
+    outputs="text",
+    title="Alpaca-7B Q4 CPU",
+    description="Google Drive'dan indirilen Q4 quantized Alpaca modelini CPU üzerinde çalıştırır."
+)
+# Arayüzü başlat
+if __name__ == "__main__":
+    iface.launch()