Spaces:
Running
on
Zero
Running
on
Zero
Upload step03_chatbot.py with huggingface_hub
Browse files- step03_chatbot.py +2 -1
step03_chatbot.py
CHANGED
|
@@ -697,6 +697,7 @@ class GenericRAGChatbot:
|
|
| 697 |
except:
|
| 698 |
return 0.0
|
| 699 |
|
|
|
|
| 700 |
def search_documents(self, query: str, final_k: int = None, use_reranking: bool = None) -> List[Dict]:
|
| 701 |
"""
|
| 702 |
Recherche avancée avec reranking en deux étapes
|
|
@@ -1106,7 +1107,7 @@ def _create_rag_system():
|
|
| 1106 |
# Paramètres par défaut optimisés selon l'environnement
|
| 1107 |
if is_zerogpu:
|
| 1108 |
default_config = {
|
| 1109 |
-
'generation_model': "Qwen/Qwen3-
|
| 1110 |
'use_flash_attention': True, # ZeroGPU supporte Flash Attention
|
| 1111 |
'use_reranker': True, # GPU puissant, reranking activé
|
| 1112 |
'initial_k': 30, # Plus de candidats avec GPU puissant
|
|
|
|
| 697 |
except:
|
| 698 |
return 0.0
|
| 699 |
|
| 700 |
+
@spaces.GPU(duration=60) # ZeroGPU: GPU pour embedding et reranking
|
| 701 |
def search_documents(self, query: str, final_k: int = None, use_reranking: bool = None) -> List[Dict]:
|
| 702 |
"""
|
| 703 |
Recherche avancée avec reranking en deux étapes
|
|
|
|
| 1107 |
# Paramètres par défaut optimisés selon l'environnement
|
| 1108 |
if is_zerogpu:
|
| 1109 |
default_config = {
|
| 1110 |
+
'generation_model': "Qwen/Qwen3-4B-Instruct-2507", # Modèle qui fonctionne sur ZeroGPU
|
| 1111 |
'use_flash_attention': True, # ZeroGPU supporte Flash Attention
|
| 1112 |
'use_reranker': True, # GPU puissant, reranking activé
|
| 1113 |
'initial_k': 30, # Plus de candidats avec GPU puissant
|