Spaces:

Xianfish9
/

DeepKMulti

Sleeping

App Files Files Community

Xianfish9 commited on Oct 21, 2025

Commit

cf6e0f3

verified ·

1 Parent(s): ded76e3

Update app.py

Browse files

Files changed (1) hide show

app.py +17 -16

app.py CHANGED Viewed

@@ -59,55 +59,56 @@ def extract_features_from_seq(sequence_list):
 # --- 4. 核心预测函数 ---
 def predict(sequence_input):
     if model is None:
-        # 如果模型加载失败，可以提前抛出错误
         raise gr.Error("模型未能加载或初始化失败，请检查后台日志。")
     if not sequence_input or not isinstance(sequence_input, str):
-        # 对于无效输入，也直接抛出错误
         raise gr.Error("请输入有效的生物序列。")
     cleaned_sequence = sequence_input.strip().upper()
     sequence_list = [cleaned_sequence]
-    # !!! 移除这里的 try...except !!!
-    # 让任何可能发生的错误自然地被Gradio捕获
     x1_np, x2_np = extract_features_from_seq(sequence_list)
-    # 将 NumPy 数组转换为 PyTorch 张量
     tensor_x1 = torch.tensor(x1_np).to(device)
     tensor_x2 = torch.tensor(x2_np).to(device)
-    # 模型预测
     with torch.no_grad():
         outputs = model(tensor_x1, tensor_x2)
-    # 计算概率
     probabilities = torch.sigmoid(outputs).squeeze().cpu().numpy()
-    # 准备输出结果
     labels = ["类别 A (a)", "类别 C (c)", "类别 M (m)", "类别 S (s)"]
-    # 确保即使只有一个序列，结果也能正确处理
-    if probabilities.ndim == 0: # 如果只有一个输出
-        probabilities = [probabilities]
     result = {label: float(prob) for label, prob in zip(labels, probabilities)}
     return result
 # --- 5. 创建并启动 Gradio 界面 ---
 demo = gr.Interface(
     fn=predict,
     inputs=gr.Textbox(
         lines=7,
         label="输入生物序列 (Input Sequence)",
-        placeholder="请在这里粘贴你的序列..."
     ),
     outputs=gr.Label(num_top_classes=4, label="预测概率 (Prediction Probabilities)"),
     title="CAFN 模型部署：多标签序列分类器",
-    description="输入一个生物序列，模型将预测它属于四个类别 (A, C, M, S) 中每一个的概率。",
     examples=[
-        ["PLEPIPIVAAAAA"],
-        ["GMWSGGGGISGSLIIVIRAELGVPSGMMILGYLN"],
     ]
 )

 # --- 4. 核心预测函数 ---
 def predict(sequence_input):
     if model is None:
         raise gr.Error("模型未能加载或初始化失败，请检查后台日志。")
     if not sequence_input or not isinstance(sequence_input, str):
         raise gr.Error("请输入有效的生物序列。")
     cleaned_sequence = sequence_input.strip().upper()
+    # --- 新增：在这里进行长度检查 ---
+    EXPECTED_LENGTH = 49  # 定义期望的序列长度
+    if len(cleaned_sequence) != EXPECTED_LENGTH:
+        raise gr.Error(f"输入序列长度错误！模型要求序列长度必须为 {EXPECTED_LENGTH} 个字符，但您输入的长度为 {len(cleaned_sequence)}。")
     sequence_list = [cleaned_sequence]
+    # 现在只有在长度正确时，才会执行下面的特征提取
     x1_np, x2_np = extract_features_from_seq(sequence_list)
     tensor_x1 = torch.tensor(x1_np).to(device)
     tensor_x2 = torch.tensor(x2_np).to(device)
     with torch.no_grad():
         outputs = model(tensor_x1, tensor_x2)
     probabilities = torch.sigmoid(outputs).squeeze().cpu().numpy()
     labels = ["类别 A (a)", "类别 C (c)", "类别 M (m)", "类别 S (s)"]
     result = {label: float(prob) for label, prob in zip(labels, probabilities)}
     return result
 # --- 5. 创建并启动 Gradio 界面 ---
+valid_example_sequence = "CGKSFIWSSTLFKHKRIHTGEKPYKCEECGKAFNHSQILLHIRHKRMHT"[:49]# 简单用49个'A'作为示例，你可以替换成一个更有代表性的序列
 demo = gr.Interface(
     fn=predict,
     inputs=gr.Textbox(
         lines=7,
         label="输入生物序列 (Input Sequence)",
+        # 在占位符中提示长度要求
+        placeholder="请在这里粘贴长度为 49 的序列..."
     ),
     outputs=gr.Label(num_top_classes=4, label="预测概率 (Prediction Probabilities)"),
     title="CAFN 模型部署：多标签序列分类器",
+    # 在描述中明确强调长度要求
+    description="输入一个生物序列，模型将预测它属于四个类别 (A, C, M, S) 中每一个的概率。\n\n**重要提示：本模型要求输入的序列长度必须为 49 个字符。**",
+    # 提供一个或多个长度正确的示例
     examples=[
+        [valid_example_sequence],
+        # 如果有其他示例，也确保它们长度是49
+        # ["LFPYASLRRWHQNVQDLMVAIDNLQEFFSSLPKGLHLLLRLQFLPQSL"[:49]]
     ]
 )