Spaces:

KJ24
/

chunkr-api

Runtime error

KJ24 commited on Jun 12, 2025

Commit

ecd203a

verified ·

1 Parent(s): 1737ef1

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -54,7 +54,7 @@ async def chunk_text(data: ChunkRequest):
         # ✅ Chargement du modèle LLM depuis Hugging Face (GGUF distant)
         llm = LlamaCPP(
-            model_url="https://huggingface.co/leafspark/Mistral-7B-Instruct-v0.2-Q4_K_M-GGUF/resolve/main/mistral-7b-instruct-v0.2.Q4_K_M.gguf",
             temperature=0.1,
             max_new_tokens=512,
             context_window=2048,
@@ -62,6 +62,11 @@ async def chunk_text(data: ChunkRequest):
             model_kwargs={"n_gpu_layers": 1},
         )
         print("✅ ✔️ Modèle LLM chargé sans erreur on continue...")
         # ✅ Définition d’un wrapper simple pour l’embedding local

         # ✅ Chargement du modèle LLM depuis Hugging Face (GGUF distant)
         llm = LlamaCPP(
+            model_url="https://huggingface.co/TheBloke/CodeLlama-7B-Instruct-GGUF/resolve/main/codellama-7b-instruct.Q4_K_M.gguf",
             temperature=0.1,
             max_new_tokens=512,
             context_window=2048,
             model_kwargs={"n_gpu_layers": 1},
         )
+        print("✅✅ Le modèle CodeLlama-7B-Instruct Q4_K_M a été chargé sans erreur...")
         print("✅ ✔️ Modèle LLM chargé sans erreur on continue...")
         # ✅ Définition d’un wrapper simple pour l’embedding local