Spaces:

fiewolf1000
/

Cross-Encoder

Runtime error

App Files Files Community

fiewolf1000 commited on Sep 23, 2025

Commit

c025244

verified ·

1 Parent(s): d8156e7

Update app.py

Browse files

Files changed (1) hide show

app.py +26 -5

app.py CHANGED Viewed

@@ -97,18 +97,39 @@ class GPTResponse(BaseModel):
     usage: dict = {"prompt_tokens": 0, "completion_tokens": 0, "total_tokens": 0}
 # ------------------- 5. 加载 Cross-Encoder 模型（全局唯一实例） -------------------
 class CrossEncoderModel:
     def __init__(self, model_name: str = "cross-encoder/ms-marco-MiniLM-L-6-v2"):
         self.model_name = model_name
-        # 加载分词器和模型（从缓存目录加载，避免权限问题）
-        self.tokenizer = AutoTokenizer.from_pretrained(model_name)
-        self.model = AutoModelForSequenceClassification.from_pretrained(model_name)
-        # 自动选择设备（GPU 优先，无则用 CPU）
         self.device = "cuda" if torch.cuda.is_available() else "cpu"
         self.model.to(self.device)
-        self.model.eval()  # 推理模式，关闭 Dropout
         print(f"模型加载完成！使用设备：{self.device}")
     def rerank(self, query: str, documents: List[str], top_k: int, truncation: bool) -> List[DocumentScore]:
         """核心重排序逻辑：计算查询与文档的相关性并排序"""
         # 参数校验

     usage: dict = {"prompt_tokens": 0, "completion_tokens": 0, "total_tokens": 0}
 # ------------------- 5. 加载 Cross-Encoder 模型（全局唯一实例） -------------------
+# 在 CrossEncoderModel 类的 __init__ 方法前添加缓存目录验证
 class CrossEncoderModel:
     def __init__(self, model_name: str = "cross-encoder/ms-marco-MiniLM-L-6-v2"):
         self.model_name = model_name
+        # 【新增】验证缓存目录是否可写
+        cache_dir = os.environ.get("TRANSFORMERS_CACHE", "/tmp/huggingface_cache")
+        try:
+            # 尝试在缓存目录创建测试文件，验证权限
+            test_file = os.path.join(cache_dir, "test_write_permission.txt")
+            with open(test_file, "w") as f:
+                f.write("test")
+            os.remove(test_file)  # 验证后删除测试文件
+            print(f"缓存目录权限验证通过：{cache_dir}")
+        except Exception as e:
+            raise RuntimeError(f"缓存目录不可写，请检查权限：{cache_dir}，错误：{str(e)}")
+        # 加载模型（确保使用指定的缓存目录）
+        self.tokenizer = AutoTokenizer.from_pretrained(
+            model_name,
+            cache_dir=cache_dir  # 显式指定缓存目录
+        )
+        self.model = AutoModelForSequenceClassification.from_pretrained(
+            model_name,
+            cache_dir=cache_dir  # 显式指定缓存目录
+        )
         self.device = "cuda" if torch.cuda.is_available() else "cpu"
         self.model.to(self.device)
+        self.model.eval()
         print(f"模型加载完成！使用设备：{self.device}")
     def rerank(self, query: str, documents: List[str], top_k: int, truncation: bool) -> List[DocumentScore]:
         """核心重排序逻辑：计算查询与文档的相关性并排序"""
         # 参数校验