tbdavid2019 commited on
Commit
cfe6c4b
·
1 Parent(s): 0672856
Files changed (2) hide show
  1. README.md +123 -0
  2. requirements.txt +1 -0
README.md CHANGED
@@ -9,4 +9,127 @@ app_file: app.py
9
  pinned: false
10
  short_description: 原tbdavid2019/PDF2podcast拆出的劇本生成(1)
11
  ---
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
12
 
 
9
  pinned: false
10
  short_description: 原tbdavid2019/PDF2podcast拆出的劇本生成(1)
11
  ---
12
+ ---
13
+ title: PDF2podcast 1 Script
14
+ emoji: 🔥
15
+ colorFrom: pink
16
+ colorTo: indigo
17
+ sdk: gradio
18
+ sdk_version: 5.23.2
19
+ app_file: app.py
20
+ pinned: false
21
+ short_description: 原tbdavid2019/PDF2podcast拆出的劇本生成(1)
22
+ ---
23
+
24
+ # PDF2Podcast 腳本生成器
25
+
26
+ PDF2Podcast 是一個強大的文件轉換工具,能夠將 PDF、TXT 和 EPUB 檔案轉換成生動的對話腳本。此工具特別適合創建 podcast、講座、教學內容或摘要,透過大型語言模型 (LLM) 將靜態文字轉換為引人入勝的對話或演講稿。
27
+
28
+ ## 功能特點
29
+
30
+ - **多種檔案格式支援**:可處理 PDF、TXT 和 EPUB 檔案
31
+ - **多種輸出模板**:
32
+ - Podcast 對話(兩位主持人 David 和 Cordelia)
33
+ - 科學材料發現摘要(教授與學生對話)
34
+ - 講座腳本(單一演講者)
35
+ - 一般摘要(約 1024 字)
36
+ - 簡短摘要(約 256 字)
37
+ - **自定義提示詞**:可完全自定義所有提示詞模板
38
+ - **彈性 API 整合**:支援 OpenAI API 及其他相容的 API 端點
39
+ - **模型選擇**:可從連接的 API 獲取並選擇可用的語言模型
40
+ - **繁體中文輸出**:預設生成繁體中文腳本
41
+ - **友善的使用者介面**:基於 Gradio 的直觀操作界面
42
+
43
+ ## 安裝指南
44
+
45
+ ### 前置需求
46
+
47
+ - Python 3.7 或更高版本
48
+ - pip 套件管理器
49
+
50
+ ### 安裝步驟
51
+
52
+ 1. 複製此專案到本地:
53
+ ```bash
54
+ git clone https://github.com/yourusername/PDF2podcast.git
55
+ cd PDF2podcast
56
+ ```
57
+
58
+ 2. 安裝所需依賴:
59
+ ```bash
60
+ pip install -r requirements.txt
61
+ ```
62
+
63
+ 3. 設定 API 金鑰(可選):
64
+ ```bash
65
+ cp .env.example .env
66
+ # 編輯 .env 檔案,添加您的 API 金鑰
67
+ ```
68
+
69
+ ## 使用方法
70
+
71
+ 1. 啟動應用程式:
72
+ ```bash
73
+ python app.py
74
+ ```
75
+
76
+ 2. 在瀏覽器中開啟顯示的 URL(通常是 http://127.0.0.1:7860)
77
+
78
+ 3. 上傳您想要轉換的檔案(PDF、TXT 或 EPUB)
79
+
80
+ 4. 設定 API 參數:
81
+ - 輸入 API Base URL(預設為 https://gemini.david888.com/v1)
82
+ - 輸入您的 LLM API 金鑰
83
+ - 點擊「獲取模型列表」按鈕
84
+
85
+ 5. 選擇提示詞模板或自定義提示詞
86
+
87
+ 6. 點擊「生成腳本」按鈕
88
+
89
+ 7. 複製或下載生成的腳本
90
+
91
+ ## 提示詞模板說明
92
+
93
+ ### Podcast 模板
94
+ 生成兩位主持人(David 和 Cordelia)之間的對話,適合製作 podcast 節目。對話風格模仿 All-In-Podcast,內容豐富且互動性強。
95
+
96
+ ### SciAgents 材料發現摘要
97
+ 生成教授與學生之間的對話,專注於描述新材料的特性和發現。教授的風格類似理查德·費曼,深入淺出地解釋複雜概念。
98
+
99
+ ### 講座模板
100
+ 生成單一演講者的講座腳本,風格類似理查德·費曼教授,適合教學或演講場合。
101
+
102
+ ### 摘要模板
103
+ 生成約 1024 字的內容摘要,保留原文的關鍵點和重要概念。
104
+
105
+ ### 簡短摘要模板
106
+ 生成約 256 字的簡潔摘要,適合快速了解文件內容。
107
+
108
+ ## 自定義選項
109
+
110
+ 您可以自定義以下提示詞部分:
111
+ - **介紹提示詞**:設定整體任務和風格
112
+ - **文本分析提示詞**:指導如何分析輸入文本
113
+ - **腦力激盪提示詞**:引導創意思考過程
114
+ - **前導提示詞**:設定對話或講座的開場
115
+ - **對話提示詞**:定義對話的結構和風格
116
+ - **自定義提示詞**:添加額外的特定指令
117
+
118
+ ## 依賴套件
119
+
120
+ 主要依賴套件包括:
121
+ - gradio:用於創建 Web 介面
122
+ - pymupdf:用於 PDF 文件處理
123
+ - ebooklib:用於 EPUB 文件處理
124
+ - beautifulsoup4:用於 HTML 內容解析
125
+ - requests:用於 API 通訊
126
+ - python-dotenv:用於環境變數管理
127
+
128
+ 完整依賴列表請參見 `requirements.txt` 檔案。
129
+
130
+ ## 注意事項
131
+
132
+ - 處理大型檔案可能需要較長時間
133
+ - API 使用可能會產生費用,請查閱您使用的 API 提供商的計費政策
134
+ - 生成的內容質量取決於所選模型和提供的提示詞
135
 
requirements.txt CHANGED
@@ -1,3 +1,4 @@
 
1
  gradio
2
  ebooklib
3
  loguru
 
1
+ #updated: 2025
2
  gradio
3
  ebooklib
4
  loguru