--- title: BERT Breast Cancer Survival Prediction emoji: 🏥 colorFrom: blue colorTo: pink sdk: gradio sdk_version: "5.5.0" app_file: app.py pinned: false --- # BERT 乳癌存活預測大型微調應用(Fine-tuning) ## 🎯 專案簡介 這是一個互動式的 BERT 模型訓練平台,專門用於乳癌患者存活率預測。使用者可以上傳自己的資料集,調整訓練參數,並即時查看訓練結果。 ## ✨ 功能特色 - **資料分析**: 自動分析上傳的 CSV 檔案,顯示資料分布 - **模型訓練**: 使用 BERT-base-uncased 進行 fine-tuning - **類別平衡**: 支援權重調整以處理資料不平衡問題 - **即時預測**: 訓練完成後可立即測試模型 - **視覺化報告**: 提供詳細的訓練指標和混淆矩陣 ## 📋 使用步驟 ### 1. 準備資料 準備包含以下欄位的 CSV 檔案: - `Text`: 病歷文本描述 - `label`: 0(存活)或 1(死亡) ### 2. 上傳資料 在「資料上傳」頁面上傳您的 CSV 檔案,系統會自動分析資料分布。 ### 3. 調整參數 在「模型訓練」頁面調整: - 權重倍數(處理類別不平衡) - 訓練輪數 - 批次大小 - 學習率 ### 4. 開始訓練 點擊「開始訓練」按鈕,等待模型訓練完成。 ### 5. 測試預測 在「模型預測」頁面輸入文本進行預測。 ## 🛠️ 技術規格 - **基礎模型**: bert-base-uncased - **框架**: PyTorch + Transformers - **介面**: Gradio - **任務類型**: 二元分類 ## 📊 評估指標 模型提供以下評估指標: - F1 Score - Accuracy - Precision & Recall - Sensitivity & Specificity - AUC (Area Under Curve) - 混淆矩陣 ## ⚠️ 注意事項 1. **資料隱私**: 請確保上傳的資料已去識別化 2. **資料量**: 建議至少 100 筆訓練資料 3. **訓練時間**: 依資料量和參數設定,通常需要 5-15 分鐘 4. **GPU 支援**: 使用 GPU 可顯著加速訓練