Spaces:

VincentGOURBIN
/

swift-mlx-qwen3-chatbot

Running on Zero

VincentGOURBIN commited on Aug 22

Commit

65a78ec

verified ·

1 Parent(s): b7e8377

Upload step03_chatbot.py with huggingface_hub

Files changed (1) hide show

step03_chatbot.py CHANGED Viewed

@@ -697,6 +697,7 @@ class GenericRAGChatbot:
         except:
             return 0.0
     def search_documents(self, query: str, final_k: int = None, use_reranking: bool = None) -> List[Dict]:
         """
         Recherche avancée avec reranking en deux étapes
@@ -1106,7 +1107,7 @@ def _create_rag_system():
     # Paramètres par défaut optimisés selon l'environnement
     if is_zerogpu:
         default_config = {
-            'generation_model': "Qwen/Qwen3-1.5B-Instruct-2507",  # Modèle plus léger pour ZeroGPU
             'use_flash_attention': True,   # ZeroGPU supporte Flash Attention
             'use_reranker': True,          # GPU puissant, reranking activé
             'initial_k': 30,               # Plus de candidats avec GPU puissant

         except:
             return 0.0
+    @spaces.GPU(duration=60)  # ZeroGPU: GPU pour embedding et reranking
     def search_documents(self, query: str, final_k: int = None, use_reranking: bool = None) -> List[Dict]:
         """
         Recherche avancée avec reranking en deux étapes
     # Paramètres par défaut optimisés selon l'environnement
     if is_zerogpu:
         default_config = {
+            'generation_model': "Qwen/Qwen3-4B-Instruct-2507",    # Modèle qui fonctionne sur ZeroGPU
             'use_flash_attention': True,   # ZeroGPU supporte Flash Attention
             'use_reranker': True,          # GPU puissant, reranking activé
             'initial_k': 30,               # Plus de candidats avec GPU puissant