File size: 1,935 Bytes
1c8f60c
 
 
 
 
 
971c817
1c8f60c
 
 
 
3ddbec1
c2d9cf4
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1c8f60c
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
---
title: BERT Breast Cancer Survival Prediction
emoji: 🏥
colorFrom: blue
colorTo: pink
sdk: gradio
sdk_version: "5.5.0"
app_file: app.py
pinned: false
---

# BERT 乳癌存活預測大型微調應用(Fine-tuning)

## 🎯 專案簡介

這是一個互動式的 BERT 模型訓練平台,專門用於乳癌患者存活率預測。使用者可以上傳自己的資料集,調整訓練參數,並即時查看訓練結果。

## ✨ 功能特色

- **資料分析**: 自動分析上傳的 CSV 檔案,顯示資料分布
- **模型訓練**: 使用 BERT-base-uncased 進行 fine-tuning
- **類別平衡**: 支援權重調整以處理資料不平衡問題
- **即時預測**: 訓練完成後可立即測試模型
- **視覺化報告**: 提供詳細的訓練指標和混淆矩陣

## 📋 使用步驟

### 1. 準備資料
準備包含以下欄位的 CSV 檔案:
- `Text`: 病歷文本描述
- `label`: 0(存活)或 1(死亡)

### 2. 上傳資料
在「資料上傳」頁面上傳您的 CSV 檔案,系統會自動分析資料分布。

### 3. 調整參數
在「模型訓練」頁面調整:
- 權重倍數(處理類別不平衡)
- 訓練輪數
- 批次大小
- 學習率

### 4. 開始訓練
點擊「開始訓練」按鈕,等待模型訓練完成。

### 5. 測試預測
在「模型預測」頁面輸入文本進行預測。

## 🛠️ 技術規格

- **基礎模型**: bert-base-uncased
- **框架**: PyTorch + Transformers
- **介面**: Gradio
- **任務類型**: 二元分類

## 📊 評估指標

模型提供以下評估指標:
- F1 Score
- Accuracy
- Precision & Recall
- Sensitivity & Specificity
- AUC (Area Under Curve)
- 混淆矩陣

## ⚠️ 注意事項

1. **資料隱私**: 請確保上傳的資料已去識別化
2. **資料量**: 建議至少 100 筆訓練資料
3. **訓練時間**: 依資料量和參數設定,通常需要 5-15 分鐘
4. **GPU 支援**: 使用 GPU 可顯著加速訓練