1111 / README.md
smartTranscend's picture
Update README.md
3ddbec1 verified
---
title: BERT Breast Cancer Survival Prediction
emoji: 🏥
colorFrom: blue
colorTo: pink
sdk: gradio
sdk_version: "5.5.0"
app_file: app.py
pinned: false
---
# BERT 乳癌存活預測大型微調應用(Fine-tuning)
## 🎯 專案簡介
這是一個互動式的 BERT 模型訓練平台,專門用於乳癌患者存活率預測。使用者可以上傳自己的資料集,調整訓練參數,並即時查看訓練結果。
## ✨ 功能特色
- **資料分析**: 自動分析上傳的 CSV 檔案,顯示資料分布
- **模型訓練**: 使用 BERT-base-uncased 進行 fine-tuning
- **類別平衡**: 支援權重調整以處理資料不平衡問題
- **即時預測**: 訓練完成後可立即測試模型
- **視覺化報告**: 提供詳細的訓練指標和混淆矩陣
## 📋 使用步驟
### 1. 準備資料
準備包含以下欄位的 CSV 檔案:
- `Text`: 病歷文本描述
- `label`: 0(存活)或 1(死亡)
### 2. 上傳資料
在「資料上傳」頁面上傳您的 CSV 檔案,系統會自動分析資料分布。
### 3. 調整參數
在「模型訓練」頁面調整:
- 權重倍數(處理類別不平衡)
- 訓練輪數
- 批次大小
- 學習率
### 4. 開始訓練
點擊「開始訓練」按鈕,等待模型訓練完成。
### 5. 測試預測
在「模型預測」頁面輸入文本進行預測。
## 🛠️ 技術規格
- **基礎模型**: bert-base-uncased
- **框架**: PyTorch + Transformers
- **介面**: Gradio
- **任務類型**: 二元分類
## 📊 評估指標
模型提供以下評估指標:
- F1 Score
- Accuracy
- Precision & Recall
- Sensitivity & Specificity
- AUC (Area Under Curve)
- 混淆矩陣
## ⚠️ 注意事項
1. **資料隱私**: 請確保上傳的資料已去識別化
2. **資料量**: 建議至少 100 筆訓練資料
3. **訓練時間**: 依資料量和參數設定,通常需要 5-15 分鐘
4. **GPU 支援**: 使用 GPU 可顯著加速訓練