Spaces:
Paused
Paused
Create README.md
Browse files
README.md
CHANGED
|
@@ -1,13 +1,78 @@
|
|
| 1 |
-
|
| 2 |
-
|
| 3 |
-
|
| 4 |
-
|
| 5 |
-
|
| 6 |
-
|
| 7 |
-
|
| 8 |
-
|
| 9 |
-
|
| 10 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 11 |
---
|
| 12 |
|
| 13 |
-
|
|
|
|
| 1 |
+
# BERT 乳癌存活預測訓練平台
|
| 2 |
+
|
| 3 |
+
## 🎯 專案簡介
|
| 4 |
+
|
| 5 |
+
這是一個互動式的 BERT 模型訓練平台,專門用於乳癌患者存活率預測。使用者可以上傳自己的資料集,調整訓練參數,並即時查看訓練結果。
|
| 6 |
+
|
| 7 |
+
## ✨ 功能特色
|
| 8 |
+
|
| 9 |
+
- **資料分析**: 自動分析上傳的 CSV 檔案,顯示資料分布
|
| 10 |
+
- **模型訓練**: 使用 BERT-base-uncased 進行 fine-tuning
|
| 11 |
+
- **類別平衡**: 支援權重調整以處理資料不平衡問題
|
| 12 |
+
- **即時預測**: 訓練完成後可立即測試模型
|
| 13 |
+
- **視覺化報告**: 提供詳細的訓練指標和混淆矩陣
|
| 14 |
+
|
| 15 |
+
## 📋 使用步驟
|
| 16 |
+
|
| 17 |
+
### 1. 準備資料
|
| 18 |
+
準備包含以下欄位的 CSV 檔案:
|
| 19 |
+
- `Text`: 病歷文本描述
|
| 20 |
+
- `label`: 0(存活)或 1(死亡)
|
| 21 |
+
|
| 22 |
+
### 2. 上傳資料
|
| 23 |
+
在「資料上傳」頁面上傳您的 CSV 檔案,系統會自動分析資料分布。
|
| 24 |
+
|
| 25 |
+
### 3. 調整參數
|
| 26 |
+
在「模型訓練」頁面調整:
|
| 27 |
+
- 權重倍數(處理類別不平衡)
|
| 28 |
+
- 訓練輪數
|
| 29 |
+
- 批次大小
|
| 30 |
+
- 學習率
|
| 31 |
+
|
| 32 |
+
### 4. 開始訓練
|
| 33 |
+
點擊「開始訓練」按鈕,等待模型訓練完成。
|
| 34 |
+
|
| 35 |
+
### 5. 測試預測
|
| 36 |
+
在「模型預測」頁面輸入文本進行預測。
|
| 37 |
+
|
| 38 |
+
## 🛠️ 技術規格
|
| 39 |
+
|
| 40 |
+
- **基礎模型**: bert-base-uncased
|
| 41 |
+
- **框架**: PyTorch + Transformers
|
| 42 |
+
- **介面**: Gradio
|
| 43 |
+
- **任務類型**: 二元分類
|
| 44 |
+
|
| 45 |
+
## 📊 評估指標
|
| 46 |
+
|
| 47 |
+
模型提供以下評估指標:
|
| 48 |
+
- F1 Score
|
| 49 |
+
- Accuracy
|
| 50 |
+
- Precision & Recall
|
| 51 |
+
- Sensitivity & Specificity
|
| 52 |
+
- AUC (Area Under Curve)
|
| 53 |
+
- 混淆矩陣
|
| 54 |
+
|
| 55 |
+
## ⚠️ 注意事項
|
| 56 |
+
|
| 57 |
+
1. **資料隱私**: 請確保上傳的資料已去識別化
|
| 58 |
+
2. **資料量**: 建議至少 100 筆訓練資料
|
| 59 |
+
3. **訓練時間**: 依資料量和參數設定,通常需要 5-15 分鐘
|
| 60 |
+
4. **GPU 支援**: 使用 GPU 可顯著加速訓練
|
| 61 |
+
|
| 62 |
+
## 🔗 相關資源
|
| 63 |
+
|
| 64 |
+
- [BERT 論文](https://arxiv.org/abs/1810.04805)
|
| 65 |
+
- [Transformers 文檔](https://huggingface.co/docs/transformers)
|
| 66 |
+
- [Gradio 文檔](https://gradio.app/docs/)
|
| 67 |
+
|
| 68 |
+
## 📝 授權
|
| 69 |
+
|
| 70 |
+
MIT License
|
| 71 |
+
|
| 72 |
+
## 👥 作者
|
| 73 |
+
|
| 74 |
+
[您的名字]
|
| 75 |
+
|
| 76 |
---
|
| 77 |
|
| 78 |
+
*此專案僅供研究和教育用途,不應作為實際醫療決策的唯一依據。*
|