PBThuong96 commited on
Commit
4c3e7af
·
verified ·
1 Parent(s): bcc807e

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +8 -4
app.py CHANGED
@@ -56,9 +56,11 @@ FORCE_REBUILD_DB = False
56
  MAX_HISTORY_TURNS = 4
57
 
58
  # ---------- CẤU HÌNH DATASET PERSISTENT (MIỄN PHÍ) ----------
59
- HF_USERNAME = "PBThuong96" # 🔴 THAY BẰNG TÊN CỦA BẠN
 
60
  DATASET_NAME = "deepmed-db"
61
- DATASET_REPO = f"datasets/{HF_USERNAME}/{DATASET_NAME}"
 
62
 
63
  # ---------- XÁC THỰC HUGGING FACE ----------
64
  if HF_TOKEN:
@@ -78,6 +80,7 @@ def download_persistent_data():
78
  logging.info("📥 Đang tải Chroma DB từ Dataset...")
79
  snapshot_download(
80
  repo_id=DATASET_REPO,
 
81
  allow_patterns=f"{DB_PATH}/*",
82
  local_dir=".",
83
  local_dir_use_symlinks=False,
@@ -92,6 +95,7 @@ def download_persistent_data():
92
  logging.info("📥 Đang tải splits_cache.pkl...")
93
  snapshot_download(
94
  repo_id=DATASET_REPO,
 
95
  allow_patterns=SPLITS_CACHE,
96
  local_dir=".",
97
  local_dir_use_symlinks=False,
@@ -280,7 +284,7 @@ def get_retrievers():
280
  model_name="BAAI/bge-reranker-v2-m3",
281
  model_kwargs={'device': 'cpu', 'low_cpu_mem_usage': True}
282
  )
283
- compressor = CrossEncoderReranker(model=reranker_model, top_n=5)
284
  deep_retriever = ContextualCompressionRetriever(
285
  base_compressor=compressor,
286
  base_retriever=ensemble_deep
@@ -303,7 +307,7 @@ class DeepMedBot:
303
  try:
304
  self.fast_retriever, self.deep_retriever = get_retrievers()
305
  self.llm = ChatGoogleGenerativeAI(
306
- model="gemini-2.5-flash", # ổn định và nhanh
307
  temperature=0.2,
308
  google_api_key=GOOGLE_API_KEY,
309
  convert_system_message_to_human=True
 
56
  MAX_HISTORY_TURNS = 4
57
 
58
  # ---------- CẤU HÌNH DATASET PERSISTENT (MIỄN PHÍ) ----------
59
+ # 🔴 THAY YOUR-USERNAME BẰNG TÊN THẬT CỦA BẠN (VÍ DỤ: PBThuong96)
60
+ HF_USERNAME = "your-username"
61
  DATASET_NAME = "deepmed-db"
62
+ # ⚠️ QUAN TRỌNG: Không được thêm "datasets/" vào đầu, chỉ cần "username/dataset-name"
63
+ DATASET_REPO = f"{HF_USERNAME}/{DATASET_NAME}"
64
 
65
  # ---------- XÁC THỰC HUGGING FACE ----------
66
  if HF_TOKEN:
 
80
  logging.info("📥 Đang tải Chroma DB từ Dataset...")
81
  snapshot_download(
82
  repo_id=DATASET_REPO,
83
+ repo_type="dataset", # bắt buộc khi dùng dataset
84
  allow_patterns=f"{DB_PATH}/*",
85
  local_dir=".",
86
  local_dir_use_symlinks=False,
 
95
  logging.info("📥 Đang tải splits_cache.pkl...")
96
  snapshot_download(
97
  repo_id=DATASET_REPO,
98
+ repo_type="dataset",
99
  allow_patterns=SPLITS_CACHE,
100
  local_dir=".",
101
  local_dir_use_symlinks=False,
 
284
  model_name="BAAI/bge-reranker-v2-m3",
285
  model_kwargs={'device': 'cpu', 'low_cpu_mem_usage': True}
286
  )
287
+ compressor = CrossEncoderReranker(model=reranker_model, top_n=3)
288
  deep_retriever = ContextualCompressionRetriever(
289
  base_compressor=compressor,
290
  base_retriever=ensemble_deep
 
307
  try:
308
  self.fast_retriever, self.deep_retriever = get_retrievers()
309
  self.llm = ChatGoogleGenerativeAI(
310
+ model="gemini-1.5-flash", # ổn định và nhanh
311
  temperature=0.2,
312
  google_api_key=GOOGLE_API_KEY,
313
  convert_system_message_to_human=True