1111 / README.md
smartTranscend's picture
Update README.md
3ddbec1 verified

A newer version of the Gradio SDK is available: 6.9.0

Upgrade
metadata
title: BERT Breast Cancer Survival Prediction
emoji: 🏥
colorFrom: blue
colorTo: pink
sdk: gradio
sdk_version: 5.5.0
app_file: app.py
pinned: false

BERT 乳癌存活預測大型微調應用(Fine-tuning)

🎯 專案簡介

這是一個互動式的 BERT 模型訓練平台,專門用於乳癌患者存活率預測。使用者可以上傳自己的資料集,調整訓練參數,並即時查看訓練結果。

✨ 功能特色

  • 資料分析: 自動分析上傳的 CSV 檔案,顯示資料分布
  • 模型訓練: 使用 BERT-base-uncased 進行 fine-tuning
  • 類別平衡: 支援權重調整以處理資料不平衡問題
  • 即時預測: 訓練完成後可立即測試模型
  • 視覺化報告: 提供詳細的訓練指標和混淆矩陣

📋 使用步驟

1. 準備資料

準備包含以下欄位的 CSV 檔案:

  • Text: 病歷文本描述
  • label: 0(存活)或 1(死亡)

2. 上傳資料

在「資料上傳」頁面上傳您的 CSV 檔案,系統會自動分析資料分布。

3. 調整參數

在「模型訓練」頁面調整:

  • 權重倍數(處理類別不平衡)
  • 訓練輪數
  • 批次大小
  • 學習率

4. 開始訓練

點擊「開始訓練」按鈕,等待模型訓練完成。

5. 測試預測

在「模型預測」頁面輸入文本進行預測。

🛠️ 技術規格

  • 基礎模型: bert-base-uncased
  • 框架: PyTorch + Transformers
  • 介面: Gradio
  • 任務類型: 二元分類

📊 評估指標

模型提供以下評估指標:

  • F1 Score
  • Accuracy
  • Precision & Recall
  • Sensitivity & Specificity
  • AUC (Area Under Curve)
  • 混淆矩陣

⚠️ 注意事項

  1. 資料隱私: 請確保上傳的資料已去識別化
  2. 資料量: 建議至少 100 筆訓練資料
  3. 訓練時間: 依資料量和參數設定,通常需要 5-15 分鐘
  4. GPU 支援: 使用 GPU 可顯著加速訓練