Spaces:
Paused
Paused
| title: BERT Breast Cancer Survival Prediction | |
| emoji: 🏥 | |
| colorFrom: blue | |
| colorTo: pink | |
| sdk: gradio | |
| sdk_version: "5.5.0" | |
| app_file: app.py | |
| pinned: false | |
| # BERT 乳癌存活預測大型微調應用(Fine-tuning) | |
| ## 🎯 專案簡介 | |
| 這是一個互動式的 BERT 模型訓練平台,專門用於乳癌患者存活率預測。使用者可以上傳自己的資料集,調整訓練參數,並即時查看訓練結果。 | |
| ## ✨ 功能特色 | |
| - **資料分析**: 自動分析上傳的 CSV 檔案,顯示資料分布 | |
| - **模型訓練**: 使用 BERT-base-uncased 進行 fine-tuning | |
| - **類別平衡**: 支援權重調整以處理資料不平衡問題 | |
| - **即時預測**: 訓練完成後可立即測試模型 | |
| - **視覺化報告**: 提供詳細的訓練指標和混淆矩陣 | |
| ## 📋 使用步驟 | |
| ### 1. 準備資料 | |
| 準備包含以下欄位的 CSV 檔案: | |
| - `Text`: 病歷文本描述 | |
| - `label`: 0(存活)或 1(死亡) | |
| ### 2. 上傳資料 | |
| 在「資料上傳」頁面上傳您的 CSV 檔案,系統會自動分析資料分布。 | |
| ### 3. 調整參數 | |
| 在「模型訓練」頁面調整: | |
| - 權重倍數(處理類別不平衡) | |
| - 訓練輪數 | |
| - 批次大小 | |
| - 學習率 | |
| ### 4. 開始訓練 | |
| 點擊「開始訓練」按鈕,等待模型訓練完成。 | |
| ### 5. 測試預測 | |
| 在「模型預測」頁面輸入文本進行預測。 | |
| ## 🛠️ 技術規格 | |
| - **基礎模型**: bert-base-uncased | |
| - **框架**: PyTorch + Transformers | |
| - **介面**: Gradio | |
| - **任務類型**: 二元分類 | |
| ## 📊 評估指標 | |
| 模型提供以下評估指標: | |
| - F1 Score | |
| - Accuracy | |
| - Precision & Recall | |
| - Sensitivity & Specificity | |
| - AUC (Area Under Curve) | |
| - 混淆矩陣 | |
| ## ⚠️ 注意事項 | |
| 1. **資料隱私**: 請確保上傳的資料已去識別化 | |
| 2. **資料量**: 建議至少 100 筆訓練資料 | |
| 3. **訓練時間**: 依資料量和參數設定,通常需要 5-15 分鐘 | |
| 4. **GPU 支援**: 使用 GPU 可顯著加速訓練 | |