Spaces:

KJ24
/

chunkr-api

Runtime error

App Files Files Community

KJ24 commited on Jun 12, 2025

Commit

2c6bd00

verified ·

1 Parent(s): 97d2e91

Update app.py

Browse files

Files changed (1) hide show

app.py +15 -2

app.py CHANGED Viewed

@@ -52,9 +52,13 @@ async def chunk_text(data: ChunkRequest):
     try:
         # ✅ Vérification du texte reçu
         print(f"✅ Texte reçu ({len(data.text)} caractères) : {data.text[:200]}...")
         # ✅ Chargement du modèle LLM depuis Hugging Face en ligne (pas de .gguf local)
         llm = LlamaCPP(
             model_url="https://huggingface.co/leafspark/Mistral-7B-Instruct-v0.2-Q4_K_M-GGUF/resolve/main/mistral-7b-instruct-v0.2.Q4_K_M.gguf",
             temperature=0.1,
             max_new_tokens=512,
@@ -68,8 +72,13 @@ async def chunk_text(data: ChunkRequest):
             def get_text_embedding(self, text: str):
                 return get_embedding(text)
-        Settings.llm = llm
-        Settings.embed_model = SimpleEmbedding()
         import sys
@@ -87,8 +96,12 @@ async def chunk_text(data: ChunkRequest):
             nodes = parser.get_nodes_from_documents([doc])
             print(f"✅ Nombre de chunks générés : {len(nodes)}")
             print(f"🧩 Exemple chunk : {nodes[0].text[:100]}...")
         except Exception as e:
             print(f"❌ Erreur lors du split sémantique : {e}")
             nodes = fallback_splitter.get_nodes_from_documents([doc])
             print(f"⚠️ Split fallback utilisé - chunks générés : {len(nodes)}")

     try:
         # ✅ Vérification du texte reçu
         print(f"✅ Texte reçu ({len(data.text)} caractères) : {data.text[:200]}...")
+        print("✅ ✔️ Reçu – On passe à la configuration du modèle LLM...")
         # ✅ Chargement du modèle LLM depuis Hugging Face en ligne (pas de .gguf local)
         llm = LlamaCPP(
+            print("✅ ✔️ Modèle LLM chargé sans erreur – on continue...")
             model_url="https://huggingface.co/leafspark/Mistral-7B-Instruct-v0.2-Q4_K_M-GGUF/resolve/main/mistral-7b-instruct-v0.2.Q4_K_M.gguf",
             temperature=0.1,
             max_new_tokens=512,
             def get_text_embedding(self, text: str):
                 return get_embedding(text)
+        try:
+            Settings.llm = llm
+            Settings.embed_model = SimpleEmbedding()
+            print("✅ ✔️ Settings configurés avec LLM et embedding")
+        except Exception as e:
+            print(f"❌ Erreur dans la configuration des Settings : {e}")
+            return {"error": str(e)}
         import sys
             nodes = parser.get_nodes_from_documents([doc])
             print(f"✅ Nombre de chunks générés : {len(nodes)}")
             print(f"🧩 Exemple chunk : {nodes[0].text[:100]}...")
         except Exception as e:
+            import traceback
+            traceback.print_exc()
             print(f"❌ Erreur lors du split sémantique : {e}")
             nodes = fallback_splitter.get_nodes_from_documents([doc])
             print(f"⚠️ Split fallback utilisé - chunks générés : {len(nodes)}")