VincentGOURBIN commited on
Commit
65a78ec
·
verified ·
1 Parent(s): b7e8377

Upload step03_chatbot.py with huggingface_hub

Browse files
Files changed (1) hide show
  1. step03_chatbot.py +2 -1
step03_chatbot.py CHANGED
@@ -697,6 +697,7 @@ class GenericRAGChatbot:
697
  except:
698
  return 0.0
699
 
 
700
  def search_documents(self, query: str, final_k: int = None, use_reranking: bool = None) -> List[Dict]:
701
  """
702
  Recherche avancée avec reranking en deux étapes
@@ -1106,7 +1107,7 @@ def _create_rag_system():
1106
  # Paramètres par défaut optimisés selon l'environnement
1107
  if is_zerogpu:
1108
  default_config = {
1109
- 'generation_model': "Qwen/Qwen3-1.5B-Instruct-2507", # Modèle plus léger pour ZeroGPU
1110
  'use_flash_attention': True, # ZeroGPU supporte Flash Attention
1111
  'use_reranker': True, # GPU puissant, reranking activé
1112
  'initial_k': 30, # Plus de candidats avec GPU puissant
 
697
  except:
698
  return 0.0
699
 
700
+ @spaces.GPU(duration=60) # ZeroGPU: GPU pour embedding et reranking
701
  def search_documents(self, query: str, final_k: int = None, use_reranking: bool = None) -> List[Dict]:
702
  """
703
  Recherche avancée avec reranking en deux étapes
 
1107
  # Paramètres par défaut optimisés selon l'environnement
1108
  if is_zerogpu:
1109
  default_config = {
1110
+ 'generation_model': "Qwen/Qwen3-4B-Instruct-2507", # Modèle qui fonctionne sur ZeroGPU
1111
  'use_flash_attention': True, # ZeroGPU supporte Flash Attention
1112
  'use_reranker': True, # GPU puissant, reranking activé
1113
  'initial_k': 30, # Plus de candidats avec GPU puissant