TeleChars-AI-Tools

Sleeping

MarcosFRGames commited on Dec 2, 2025

Commit

41ca8d5

verified ·

1 Parent(s): 34bd15b

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -7,6 +7,7 @@ from llama_cpp import Llama
 import requests
 import tempfile
 import json
 from concurrent.futures import ThreadPoolExecutor
 app = Flask(__name__)
@@ -53,7 +54,10 @@ class LLMManager:
                     use_mlock=True,
                     mmap=True,
                     low_vram=False,
-                    vocab_only=False
                 )
                 os.remove(temp_path)
@@ -140,6 +144,7 @@ class LLMManager:
         finally:
             self.generation_lock.release()
     def get_loaded_models(self):
         """Obtener lista de modelos cargados"""

 import requests
 import tempfile
 import json
+import gc
 from concurrent.futures import ThreadPoolExecutor
 app = Flask(__name__)
                     use_mlock=True,
                     mmap=True,
                     low_vram=False,
+                    vocab_only=False,
+                    verbose=False,
+                    logits_all=False,
+                    mul_mat_q=True
                 )
                 os.remove(temp_path)
         finally:
             self.generation_lock.release()
+            gc.collect()
     def get_loaded_models(self):
         """Obtener lista de modelos cargados"""