TeleChars-AI-API1

Running

MarcosFRGames commited on Jan 7

Commit

ac47dd1

verified ·

1 Parent(s): d68e63e

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -3,6 +3,9 @@ import os
 import logging
 import threading
 import time
 from llama_cpp import Llama
 import requests
 import tempfile
@@ -14,7 +17,7 @@ app = Flask(__name__)
 logging.basicConfig(level=logging.INFO)
 MAX_CONTEXT_TOKENS = 1024 * 8
-MAX_GENERATION_TOKENS = 1024 * 4
 with open('engines.json', 'r') as f:
     MODELS = json.load(f)

 import logging
 import threading
 import time
+import subprocess
+import sys
+subprocess.check_call([sys.executable, "-m", "pip", "install", "llama-cpp-python==0.3.15"])
 from llama_cpp import Llama
 import requests
 import tempfile
 logging.basicConfig(level=logging.INFO)
 MAX_CONTEXT_TOKENS = 1024 * 8
+MAX_GENERATION_TOKENS = 1024 * 8
 with open('engines.json', 'r') as f:
     MODELS = json.load(f)