File size: 4,837 Bytes
06ba7ea | 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 | # API-Key 配置指南
## 一、大语言模型 (LLM)
### 以 DeepSeek 为例
**官方文档**:https://api-docs.deepseek.com/zh-cn/
提示: 对于中国以外用户建议使用 Gemini、Claude、ChatGPT 等主流大语言模型以获得最佳体验。
### 配置步骤
1. **申请 API Key**
- 访问平台:https://platform.deepseek.com/usage
- 登录后申请 API Key
- ⚠️ **重要**:妥善保存获取的 API Key
2. **配置参数**
- **模型名称**:`deepseek-chat`
- **Base URL**:`https://api.deepseek.com/v1`
- **API Key**:填写上一步获取的 Key
3. **API填写**
- **Web使用**: 在LLM模型表单中选择使用自定义模型,模型按照配置参数进行填写
- **本地部署**: 在config.toml中 找到`[developer.chat_models_config."deepseek-chat"]` 将配置参数填写上去,使得Web页面可以访问到该默认配置。 找到`[llm]`并配置model、base_url、api_key
## 二、多模态大模型 (VLM)
### 2.1 使用GLM-4.6V
**API Key 管理**:https://open.bigmodel.cn/usercenter/proj-mgmt/apikeys
### 配置参数
- **模型名称**:`glm-4.6v`
- **Base URL**:`https://open.bigmodel.cn/api/paas/v4/`
### 2.2 使用Qwen3-VL
**API Key管理**:进入阿里云百炼平台申请API Key https://bailian.console.aliyun.com/cn-beijing/?apiKey=1&tab=globalset#/efm/api_key
- **模型名称**:`qwen3-vl-8b-instruct`
- **Base URL**:`https://dashscope.aliyuncs.com/compatible-mode/v1`
- **参数填写**:在VLM Model表单中选择"使用自定义模型"进行参数填写。本地部署时,找到`[vlm]`并配置model、base_url、api_key,在config.toml中新增以下字段作为Web的API默认配置:
```
[developer.chat_models_config."qwen3-vl-8b-instruct"]
base_url = "https://dashscope.aliyuncs.com/compatible-mode/v1"
api_key = "YOUR_API_KEY"
timeout = 20.0
temperature = 0.1
max_retries = 2
```
### 2.3 使用Qwen3-Omni
Qwen3-Omni同样可以在阿里云百炼平台进行申请,具体参数如下,可用于omni_bgm_label.py的音频自动标注
- **模型名称**:`qwen3-omni-flash-2025-12-01`
- **Base URL**:`https://dashscope.aliyuncs.com/compatible-mode/v1`
详细文档参考:https://bailian.console.aliyun.com/cn-beijing/?tab=doc#/doc
阿里云模型列表:https://help.aliyun.com/zh/model-studio/models
计费看板:https://billing-cost.console.aliyun.com/home
## 三、Pexels 图像和视频下载API密钥配置
1. 打开Pexels网站,注册账号,申请API https://www.pexels.com/zh-cn/api/key/
<div align="center">
<img src="https://image-url-2-feature-1251524319.cos.ap-shanghai.myqcloud.com/openstoryline/docs/resource/pexels_api.png" alt="pexels下载图像和视频API申请" width="70%">
<p><em>图1: Pexels API申请页面</em></p>
</div>
2. 网页使用:找到Pexels配置,选择使用自定义key,将API key填入表单中。
<div align="center">
<img src="https://image-url-2-feature-1251524319.cos.ap-shanghai.myqcloud.com/openstoryline/docs/resource/use_pexels_api_zh.png" alt="pexels API填写" width="70%">
<p><em>图2: Pexels API 使用</em></p>
</div>
3. 本地部署的项目:我们将API填写在config.toml中的pexels_api_key字段中。作为项目的默认配置
## 四、TTS (文本转语音) 配置
### 方案一:302.ai
**服务地址**:https://302.ai/product/detail/302ai-mmaudio-text-to-speech
### 方案二:MiniMax
**订阅页面**:https://platform.minimax.io/subscribe/audio-subscription
**配置步骤**:
1. 创建 API Key
2. 访问:https://platform.minimax.io/user-center/basic-information/interface-key
3. 获取并保存 API Key
### 方案三:bytedance
1. 步骤1:开通音视频字幕生成服务
使用旧版页面,找到音视频字幕生成服务:
- 访问:https://console.volcengine.com/speech/service/9?AppID=8782592131
2. 步骤2:获取认证信息
查看账号基本信息页面:
- 访问:https://console.volcengine.com/user/basics/
<div align="center">
<img src="https://image-url-2-feature-1251524319.cos.ap-shanghai.myqcloud.com/openstoryline/docs/resource/use_bytedance_tts_zh.png" alt="Bytedance TTS API填写" width="70%">
<p><em>图3: Bytedance TTS API 使用</em></p>
</div>
需要获取以下信息:
- **UID**: 主账号信息中的 ID
- **APP ID**: 服务接口认证信息中的 APP ID
- **Access Token**: 服务接口认证信息中的 Access Token
本地部署使用修改config.toml中
```
[generate_voiceover.providers.bytedance]
uid = ""
appid = ""
access_token = ""
```
详细文档请参考:https://www.volcengine.com/docs/6561/80909?lang=zh
## 注意事项
- 所有 API Key 均需妥善保管,避免泄露
- 使用前请确认账户余额充足
- 建议定期检查 API 调用量和费用
|