Spaces:

smartTranscend
/

1111

Paused

App Files Files Community

smartTranscend commited on Oct 31, 2025

Commit

6a26e21

verified ·

1 Parent(s): f7eb620

Update app.py

Browse files

Files changed (1) hide show

app.py +40 -40

app.py CHANGED Viewed

@@ -33,7 +33,7 @@ class WeightedTrainer(Trainer):
         super().__init__(*args, **kwargs)
         self.class_weights = class_weights
-    def compute_loss(self, model, inputs, return_outputs=False, num_items_in_batch=None):
         labels = inputs.pop("labels")
         outputs = model(**inputs)
         if self.class_weights is not None:
@@ -158,22 +158,24 @@ def train_model(df_clean, weight_multiplier, epochs, batch_size, learning_rate,
             problem_type="single_label_classification"
         ).to(device)
-        # 訓練設定
         training_args = TrainingArguments(
             output_dir='./results',
             num_train_epochs=epochs,
             per_device_train_batch_size=batch_size,
-            per_device_eval_batch_size=batch_size*2,
             warmup_steps=200,
             weight_decay=0.01,
             learning_rate=learning_rate,
             logging_steps=50,
-            eval_strategy="epoch",
             save_strategy="epoch",
             load_best_model_at_end=True,
             metric_for_best_model="f1",
             report_to="none",
-            fp16=torch.cuda.is_available()  # 使用混合精度加速
         )
         # 建立 Trainer
@@ -189,22 +191,11 @@ def train_model(df_clean, weight_multiplier, epochs, batch_size, learning_rate,
         # 訓練模型
         progress(0.3, desc="開始訓練...")
-        # 訓練進度更新
-        class ProgressCallback:
-            def __init__(self, progress_bar, total_steps):
-                self.progress_bar = progress_bar
-                self.total_steps = total_steps
-                self.current_step = 0
-            def on_log(self, args, state, control, **kwargs):
-                self.current_step = state.global_step
-                progress_val = 0.3 + (0.6 * self.current_step / self.total_steps)
-                self.progress_bar(progress_val, desc=f"訓練中... (Step {self.current_step}/{self.total_steps})")
-        total_steps = len(train_dataset) // batch_size * epochs
-        progress_callback = ProgressCallback(progress, total_steps)
-        trainer.add_callback(progress_callback)
         trainer.train()
         progress(0.9, desc="評估模型...")
@@ -220,20 +211,20 @@ def train_model(df_clean, weight_multiplier, epochs, batch_size, learning_rate,
 | 指標 | 數值 |
 |------|------|
-| **F1 Score** | {results['eval_f1']:.4f} |
-| **Accuracy** | {results['eval_accuracy']:.4f} |
-| **Precision** | {results['eval_precision']:.4f} |
-| **Recall** | {results['eval_recall']:.4f} |
-| **Sensitivity** | {results['eval_sensitivity']:.4f} |
-| **Specificity** | {results['eval_specificity']:.4f} |
-| **AUC** | {results['eval_auc']:.4f} |
 ## 📈 混淆矩陣
 | | 預測:存活 | 預測:死亡 |
 |---|-----------|-----------|
-| **實際:存活** | TN={results['eval_tn']} | FP={results['eval_fp']} |
-| **實際:死亡** | FN={results['eval_fn']} | TP={results['eval_tp']} |
 ## ⚖️ 訓練設定
@@ -249,9 +240,9 @@ def train_model(df_clean, weight_multiplier, epochs, batch_size, learning_rate,
 ## 💡 模型解讀
-- **高 Precision** ({results['eval_precision']:.2f}): 預測為死亡的案例中，有 {results['eval_precision']*100:.1f}% 確實死亡
-- **高 Recall** ({results['eval_recall']:.2f}): 實際死亡的案例中，有 {results['eval_recall']*100:.1f}% 被正確識別
-- **F1 Score** ({results['eval_f1']:.2f}): 整體平衡表現 {'優秀' if results['eval_f1'] > 0.8 else '良好' if results['eval_f1'] > 0.6 else '尚可'}
 ---
 *訓練完成時間: {datetime.now().strftime('%Y-%m-%d %H:%M:%S')}*
@@ -271,7 +262,9 @@ def train_model(df_clean, weight_multiplier, epochs, batch_size, learning_rate,
         return report, results_json, gr.update(visible=True)
     except Exception as e:
-        return f"❌ 訓練錯誤：{str(e)}", None, gr.update(visible=False)
 def predict_sample(text_input):
     """預測單一樣本"""
@@ -324,6 +317,8 @@ with gr.Blocks(title="BERT 乳癌存活預測訓練平台", theme=gr.themes.Soft
     2. 調整訓練參數
     3. 開始訓練
     4. 查看結果並測試預測
     """)
     # 狀態變數
@@ -355,9 +350,9 @@ with gr.Blocks(title="BERT 乳癌存活預測訓練平台", theme=gr.themes.Soft
                     info="建議 3-5 輪"
                 )
                 batch_size_slider = gr.Slider(
-                    minimum=4, maximum=32, value=16, step=4,
                     label="批次大小 (Batch Size)",
-                    info="較小的批次大小需要更多記憶體"
                 )
                 lr_slider = gr.Number(
                     value=2e-5,
@@ -411,15 +406,20 @@ with gr.Blocks(title="BERT 乳癌存活預測訓練平台", theme=gr.themes.Soft
         - `label`: 0（存活）或 1（死亡）
         ### 參數說明
-        - **權重倍數**: 調整對少數類別的重視程度
-        - **訓練輪數**: 模型看過所有資料的次數
-        - **批次大小**: 同時處理的樣本數
-        - **學習率**: 模型更新的步幅
         ### 注意事項
         - 訓練時間依資料量和參數而定（通常 5-15 分鐘）
         - 建議至少有 100 筆以上的訓練資料
-        - GPU 會顯著加速訓練
         """)
     # 事件處理

         super().__init__(*args, **kwargs)
         self.class_weights = class_weights
+    def compute_loss(self, model, inputs, return_outputs=False):
         labels = inputs.pop("labels")
         outputs = model(**inputs)
         if self.class_weights is not None:
             problem_type="single_label_classification"
         ).to(device)
+        # 訓練設定 - 使用正確的參數名稱
         training_args = TrainingArguments(
             output_dir='./results',
             num_train_epochs=epochs,
             per_device_train_batch_size=batch_size,
+            per_device_eval_batch_size=min(batch_size*2, 32),
             warmup_steps=200,
             weight_decay=0.01,
             learning_rate=learning_rate,
             logging_steps=50,
+            evaluation_strategy="epoch",  # 正確的參數名稱
             save_strategy="epoch",
             load_best_model_at_end=True,
             metric_for_best_model="f1",
             report_to="none",
+            fp16=torch.cuda.is_available() and torch.cuda.get_device_capability()[0] >= 7,  # 只在支援的 GPU 上使用
+            push_to_hub=False,  # 明確設定為 False
+            remove_unused_columns=False  # 避免移除必要欄位
         )
         # 建立 Trainer
         # 訓練模型
         progress(0.3, desc="開始訓練...")
+        # 簡單的進度更新
+        for epoch in range(epochs):
+            progress(0.3 + (0.6 * (epoch + 1) / epochs),
+                    desc=f"訓練中... Epoch {epoch + 1}/{epochs}")
         trainer.train()
         progress(0.9, desc="評估模型...")
 | 指標 | 數值 |
 |------|------|
+| **F1 Score** | {results.get('eval_f1', 0):.4f} |
+| **Accuracy** | {results.get('eval_accuracy', 0):.4f} |
+| **Precision** | {results.get('eval_precision', 0):.4f} |
+| **Recall** | {results.get('eval_recall', 0):.4f} |
+| **Sensitivity** | {results.get('eval_sensitivity', 0):.4f} |
+| **Specificity** | {results.get('eval_specificity', 0):.4f} |
+| **AUC** | {results.get('eval_auc', 0):.4f} |
 ## 📈 混淆矩陣
 | | 預測:存活 | 預測:死亡 |
 |---|-----------|-----------|
+| **實際:存活** | TN={results.get('eval_tn', 0)} | FP={results.get('eval_fp', 0)} |
+| **實際:死亡** | FN={results.get('eval_fn', 0)} | TP={results.get('eval_tp', 0)} |
 ## ⚖️ 訓練設定
 ## 💡 模型解讀
+- **Precision** ({results.get('eval_precision', 0):.2f}): 預測為死亡的案例中的準確率
+- **Recall** ({results.get('eval_recall', 0):.2f}): 實際死亡案例的識別率
+- **F1 Score** ({results.get('eval_f1', 0):.2f}): 整體平衡表現
 ---
 *訓練完成時間: {datetime.now().strftime('%Y-%m-%d %H:%M:%S')}*
         return report, results_json, gr.update(visible=True)
     except Exception as e:
+        import traceback
+        error_msg = f"❌ 訓練錯誤：{str(e)}\n\n詳細錯誤：\n{traceback.format_exc()}"
+        return error_msg, None, gr.update(visible=False)
 def predict_sample(text_input):
     """預測單一樣本"""
     2. 調整訓練參數
     3. 開始訓練
     4. 查看結果並測試預測
+    **裝置狀態**: {f"🚀 GPU ({torch.cuda.get_device_name(0)})" if torch.cuda.is_available() else "💻 CPU (訓練會較慢)"}
     """)
     # 狀態變數
                     info="建議 3-5 輪"
                 )
                 batch_size_slider = gr.Slider(
+                    minimum=4, maximum=32, value=8, step=4,
                     label="批次大小 (Batch Size)",
+                    info="GPU 記憶體有限時請使用較小值"
                 )
                 lr_slider = gr.Number(
                     value=2e-5,
         - `label`: 0（存活）或 1（死亡）
         ### 參數說明
+        - **權重倍數**: 調整對少數類別的重視程度（0.1-2.0）
+        - **訓練輪數**: 模型看過所有資料的次數（1-10）
+        - **批次大小**: 同時處理的樣本數（4-32）
+        - **學習率**: 模型更新的步幅（建議 2e-5）
         ### 注意事項
         - 訓練時間依資料量和參數而定（通常 5-15 分鐘）
         - 建議至少有 100 筆以上的訓練資料
+        - GPU 會顯著加速訓練（約快 5-10 倍）
+        ### 常見問題
+        - **記憶體不足**: 降低批次大小
+        - **訓練太慢**: 減少訓練輪數或使用 GPU
+        - **效果不佳**: 增加訓練資料或調整權重倍數
         """)
     # 事件處理