Upload DOCS.md with huggingface_hub
Browse files
DOCS.md
ADDED
|
@@ -0,0 +1,47 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
# 音訊轉文字與優化系統使用說明
|
| 2 |
+
|
| 3 |
+
## 功能介紹
|
| 4 |
+
|
| 5 |
+
這個應用程式提供以下功能:
|
| 6 |
+
|
| 7 |
+
1. 音訊轉文字(支援 Whisper 和 ElevenLabs)
|
| 8 |
+
2. 文字優化和摘要生成
|
| 9 |
+
3. 多語言支援
|
| 10 |
+
4. Token 使用量和費用計算
|
| 11 |
+
|
| 12 |
+
## 使用步驟
|
| 13 |
+
|
| 14 |
+
1. **上傳音訊檔案**
|
| 15 |
+
- 支援格式:MP3、WAV、OGG、M4A
|
| 16 |
+
- 檔案大小限制:25MB
|
| 17 |
+
|
| 18 |
+
2. **輸入 API 金鑰**
|
| 19 |
+
- OpenAI API 金鑰(必須)
|
| 20 |
+
- ElevenLabs API 金鑰(使用 ElevenLabs 服務時必須)
|
| 21 |
+
|
| 22 |
+
3. **選擇服務和設定**
|
| 23 |
+
- 轉錄服務:Whisper 或 ElevenLabs
|
| 24 |
+
- OpenAI 模型:選擇用於文字優化的模型
|
| 25 |
+
- 語言:指定音訊的語言(可選)
|
| 26 |
+
- 說話者辨識:僅適用於 ElevenLabs
|
| 27 |
+
- 創意程度:調整文字優化的創意程度
|
| 28 |
+
|
| 29 |
+
4. **處理和結果**
|
| 30 |
+
- 點擊「處理音訊」按鈕
|
| 31 |
+
- 查看原始轉錄文字
|
| 32 |
+
- 查看優化後文字
|
| 33 |
+
- 檢視 Token 使用量
|
| 34 |
+
- 檢視費用資訊
|
| 35 |
+
|
| 36 |
+
## 安全性說明
|
| 37 |
+
|
| 38 |
+
- API 金鑰僅在當前處理中使用
|
| 39 |
+
- 不會儲存任何敏感資訊
|
| 40 |
+
- 每次使用需重新輸入 API 金鑰
|
| 41 |
+
|
| 42 |
+
## 注意事項
|
| 43 |
+
|
| 44 |
+
1. 確保網路連線穩定
|
| 45 |
+
2. 使用高品質音訊以獲得更好的轉錄效果
|
| 46 |
+
3. 注意 API 使用額度
|
| 47 |
+
4. 建議使用支援的音訊格式
|