Spaces:

Jimmy0866
/

DocSummarizer_Jimmy

Sleeping

App Files Files Community

Jimmy0866 commited on Jul 13, 2025

Commit

911955e

verified ·

1 Parent(s): d1f503e

Upload README.md

Browse files

Files changed (1) hide show

README.md +29 -59

README.md CHANGED Viewed

@@ -1,71 +1,41 @@
-# DocSummarizer_Jimmy
-🚀 這是一個簡單易用的 PDF 與文字文件摘要工具，支援 OCR 模式與簡單文字轉換模式，提供使用者選擇性處理繁體中文文件，並以 Gradio 介面展示。
 ---
-## 🧰 功能特色
-- ✅ 上傳 PDF，自動擷取文字或使用 OCR（適用掃描圖像型 PDF）
-- ✅ 上傳 TXT，進行自動摘要
-- ✅ 提供範例文件供測試（位於 `examples/` 資料夾）
-- ✅ OCR 模式與簡單模式自由切換
-- ✅ 中文介面與多語摘要模型支援
----
-## 📂 專案結構
-```
-DocSummarizer_Jimmy/
-├── app.py              # 主程式
-├── summarize.py        # 摘要處理模組
-├── pdf2text.py         # OCR 與 PDF 處理
-├── utils.py            # 工具模組
-├── requirements.txt    # 安裝依賴
-├── examples/
-│   └── example1.txt    # 範例測試文件
-```
 ---
-## ⚙️ 使用方式
-1. 安裝依賴：
-```bash
-pip install -r requirements.txt
-```
-2. 執行 Gradio 應用：
-```bash
-python app.py
-```
-3. 開啟瀏覽器後依需求：
-- 選擇上傳 `PDF` 或 `TXT`
-- 選擇 OCR 模式或簡單模式
-- 點擊「Generate Summary」生成摘要
-- 選用範例檔案進行測試（預設載入 example1.txt）
----
-## 🧠 使用模型
-- 🤖 `pszemraj/bart-large-summary-map-reduce`：適用於長文本摘要
-- 📄 `doctr`：OCR 模型，用於解析圖像 PDF
----
-## 📝 備註
-- 本工具針對繁體中文支援，OCR 輸出預設為 UTF-8。
-- 使用掃描型 PDF 時請務必勾選 OCR 模式。
-- 若遇模型下載失敗，請檢查網路或手動下載 HuggingFace 模型。
 ---
-Jimmy 工程師專案 — 持續優化中。歡迎反饋建議。

 ---
+title: DocSummarizer-Jimmy
+emoji: 📝
+colorFrom: indigo
+colorTo: blue
+sdk: gradio
+sdk_version: "4.16.0"
+app_file: app.py
+pinned: true
 ---
+# DocSummarizer-Jimmy
+一個專為中英文文件摘要設計的工具，支援 PDF 與純文字檔案（包含 OCR 光學辨識功能），並提供摘要長度選擇與多模型整合。
+## 📂 支援輸入格式
+- `.pdf`：可選擇使用 OCR（適合掃描檔）
+- `.txt`：純文字檔案
+- 手動輸入文字也可支援
+## 🔍 模式選擇
+- **簡單摘要**：適合快速擷取重點
+- **OCR 模式**：針對掃描圖像型 PDF，自動轉換為可讀文字進行摘要
+## 🛠 使用方式
+1. 上傳 PDF 或 TXT 檔案，或貼上原文
+2. 選擇模式與語言
+3. 點選「產生摘要」
+4. 可選擇不同模型以獲得多樣輸出
+## 🤖 支援模型
+- `pszemraj/bart-large-summary-cnn`
+- `pszemraj/bart-large-summary-map-reduce`
+- `facebook/bart-large-cnn`
+- `falconsai/text_summarization`（中文）
+## 📜 範例
+請參考 `examples/example1.txt` 作為輸入示範。
 ---