| # 配置指南 | |
| 本文档介绍如何配置 VoiceDialogue 系统。 | |
| ## 启动参数 | |
| 通过 `main.py` 的命令行参数可以方便地进行配置: | |
| | 参数 | 缩写 | 可选值 | 默认值 | 描述 | | |
| |---|---|---|---|---| | |
| | `--mode` | `-m` | `cli`, `api` | `cli` | 设置运行模式 | | |
| | `--language`| `-l` | `zh`, `en` | `zh` | (CLI模式) 设置用户语言 | | |
| | `--speaker` | `-s` | (动态获取) | `沈逸` | (CLI模式) 设置TTS语音角色 | | |
| | `--host` | | IP地址 | `0.0.0.0` | (API模式) 服务器主机 | | |
| | `--port` | `-p` | 端口号 | `8000` | (API模式) 服务器端口 | | |
| | `--reload`| | 无 | `False` | (API模式) 启用热重载 | | |
| **支持的说话人角色**(动态加载): | |
| - **中文角色**:`罗翔`, `马保国`, `沈逸`, `杨幂`, `周杰伦`, `马云` | |
| - **英文角色**:`Heart`, `Bella`, `Nicole` | |
| ## 高级配置 | |
| ### 大语言模型 (LLM) | |
| - **模型路径和参数**: LLM 的模型和推理参数目前在代码中硬编码,方便快速启动。 | |
| - **文件位置**: `src/VoiceDialogue/services/text/generator.py` | |
| - **自定义**: 你可以修改 `LLMResponseGenerator` 类中的配置。 | |
| ### 语音识别 (ASR) | |
| - **引擎自动选择**: 系统会根据 `--language` 参数自动选择最合适的 ASR 引擎。 | |
| - **模型配置**: ASR 模型的具体配置位于 `src/VoiceDialogue/services/speech/recognizers/manager.py`。 | |
| ### 系统提示词 (System Prompt) | |
| - **功能**: 定义 AI 角色的行为和说话风格。 | |
| - **文件位置**: `src/VoiceDialogue/services/text/generator.py` | |
| - **自定义**: 你可以修改系统提示词变量的值。 | |
| ## 构建完整应用 | |
| 项目提供了完整的构建脚本,可以一键构建包含Python后端和Electron前端的完整应用: | |
| 1. 首先,激活当前 Python 环境 | |
| ```bash | |
| source .venv/bin/activate | |
| # 或使用 conda | |
| conda activate voicedialogue | |
| ``` | |
| 2. 使用构建脚本 | |
| ```bash | |
| # 使用构建脚本(推荐) | |
| bash scripts/build.sh | |
| # 或分别构建 | |
| bash scripts/build-python.sh # 构建Python后端 | |
| bash scripts/build-electron.sh # 构建Electron前端 | |
| # 清理构建产物 | |
| bash scripts/clean.sh | |
| ``` |