Instructions to use MoYoYoTech/VoiceDialogue with libraries, inference providers, notebooks, and local apps. Follow these links to get started.

Libraries

How to use MoYoYoTech/VoiceDialogue with Transformers:

# Use a pipeline as a high-level helper
from transformers import pipeline

pipe = pipeline("text-to-speech", model="MoYoYoTech/VoiceDialogue")
messages = [
    {"role": "user", "content": "Who are you?"},
]
pipe(messages)

# Load model directly
from transformers import AutoModel
model = AutoModel.from_pretrained("MoYoYoTech/VoiceDialogue", dtype="auto")

llama-cpp-python

How to use MoYoYoTech/VoiceDialogue with llama-cpp-python:

# !pip install llama-cpp-python

from llama_cpp import Llama

llm = Llama.from_pretrained(
	repo_id="MoYoYoTech/VoiceDialogue",
	filename="assets/models/llm/qwen/Qwen3-8B-Q6_K.gguf",
)

llm.create_chat_completion(
	messages = "\"The answer to the universe is 42\""
)

Notebooks
Google Colab
Kaggle
Local Apps

llama.cpp

How to use MoYoYoTech/VoiceDialogue with llama.cpp:

Install from brew

brew install llama.cpp
# Start a local OpenAI-compatible server with a web UI:
llama-server -hf MoYoYoTech/VoiceDialogue:Q6_K
# Run inference directly in the terminal:
llama-cli -hf MoYoYoTech/VoiceDialogue:Q6_K

Install from WinGet (Windows)

winget install llama.cpp
# Start a local OpenAI-compatible server with a web UI:
llama-server -hf MoYoYoTech/VoiceDialogue:Q6_K
# Run inference directly in the terminal:
llama-cli -hf MoYoYoTech/VoiceDialogue:Q6_K

Use pre-built binary

# Download pre-built binary from:
# https://github.com/ggerganov/llama.cpp/releases
# Start a local OpenAI-compatible server with a web UI:
./llama-server -hf MoYoYoTech/VoiceDialogue:Q6_K
# Run inference directly in the terminal:
./llama-cli -hf MoYoYoTech/VoiceDialogue:Q6_K

Build from source code

git clone https://github.com/ggerganov/llama.cpp.git
cd llama.cpp
cmake -B build
cmake --build build -j --target llama-server llama-cli
# Start a local OpenAI-compatible server with a web UI:
./build/bin/llama-server -hf MoYoYoTech/VoiceDialogue:Q6_K
# Run inference directly in the terminal:
./build/bin/llama-cli -hf MoYoYoTech/VoiceDialogue:Q6_K

Use Docker

docker model run hf.co/MoYoYoTech/VoiceDialogue:Q6_K

LM Studio
Jan
Ollama
How to use MoYoYoTech/VoiceDialogue with Ollama:
```
ollama run hf.co/MoYoYoTech/VoiceDialogue:Q6_K
```

Unsloth Studio new

How to use MoYoYoTech/VoiceDialogue with Unsloth Studio:

Install Unsloth Studio (macOS, Linux, WSL)

curl -fsSL https://unsloth.ai/install.sh | sh
# Run unsloth studio
unsloth studio -H 0.0.0.0 -p 8888
# Then open http://localhost:8888 in your browser
# Search for MoYoYoTech/VoiceDialogue to start chatting

Install Unsloth Studio (Windows)

irm https://unsloth.ai/install.ps1 | iex
# Run unsloth studio
unsloth studio -H 0.0.0.0 -p 8888
# Then open http://localhost:8888 in your browser
# Search for MoYoYoTech/VoiceDialogue to start chatting

Using HuggingFace Spaces for Unsloth

# No setup required
# Open https://huggingface.co/spaces/unsloth/studio in your browser
# Search for MoYoYoTech/VoiceDialogue to start chatting

Pi new

How to use MoYoYoTech/VoiceDialogue with Pi:

Start the llama.cpp server

# Install llama.cpp:
brew install llama.cpp
# Start a local OpenAI-compatible server:
llama-server -hf MoYoYoTech/VoiceDialogue:Q6_K

Configure the model in Pi

# Install Pi:
npm install -g @mariozechner/pi-coding-agent
# Add to ~/.pi/agent/models.json:
{
  "providers": {
    "llama-cpp": {
      "baseUrl": "http://localhost:8080/v1",
      "api": "openai-completions",
      "apiKey": "none",
      "models": [
        {
          "id": "MoYoYoTech/VoiceDialogue:Q6_K"
        }
      ]
    }
  }
}

Run Pi

# Start Pi in your project directory:
pi

Hermes Agent new

How to use MoYoYoTech/VoiceDialogue with Hermes Agent:

Start the llama.cpp server

# Install llama.cpp:
brew install llama.cpp
# Start a local OpenAI-compatible server:
llama-server -hf MoYoYoTech/VoiceDialogue:Q6_K

Configure Hermes

# Install Hermes:
curl -fsSL https://hermes-agent.nousresearch.com/install.sh | bash
hermes setup
# Point Hermes at the local server:
hermes config set model.provider custom
hermes config set model.base_url http://127.0.0.1:8080/v1
hermes config set model.default MoYoYoTech/VoiceDialogue:Q6_K

Run Hermes

hermes

Docker Model Runner
How to use MoYoYoTech/VoiceDialogue with Docker Model Runner:
```
docker model run hf.co/MoYoYoTech/VoiceDialogue:Q6_K
```

Lemonade

How to use MoYoYoTech/VoiceDialogue with Lemonade:

Pull the model

# Download Lemonade from https://lemonade-server.ai/
lemonade pull MoYoYoTech/VoiceDialogue:Q6_K

Run and chat with the model

lemonade run user.VoiceDialogue-Q6_K

List all available models

lemonade list

Xin Zhang commited on Jul 11, 2025

Commit

8ead306

2 Parent(s): 73e6ae0 5258538

Merge branch 'main' of hf.co:MoYoYoTech/VoiceDialogue

Browse files

* 'main' of hf.co:MoYoYoTech/VoiceDialogue:
更新API文档
缓存user_prompts以提高性能
调整prompt的逻辑，确保展示的提示词中不包含/no_think指令
添加设置相关的API路由
在测试文件中添加对中文和英文系统提示的导入检查，以确保在未定义时能够正确加载配置。
调整LLM prompt的存放位置
增强任务有效性检查，添加日志记录以便于调试。
在生成TTS音频时始终记录生成信息。

Files changed (12) hide show

src/voice_dialogue/api/app.py +2 -1
src/voice_dialogue/api/core/config.py +19 -13
src/voice_dialogue/api/routes/__init__.py +2 -2
src/voice_dialogue/api/routes/settings_routes.py +102 -0
src/voice_dialogue/config/llm_config.py +15 -1
src/voice_dialogue/config/paths.py +22 -0
src/voice_dialogue/config/user_config.py +128 -0
src/voice_dialogue/services/audio/generator.py +3 -3
src/voice_dialogue/services/audio/player.py +2 -1
src/voice_dialogue/services/mixins.py +10 -2
src/voice_dialogue/services/text/generator.py +9 -22
tests/test_llm_dialogue.py +6 -0

src/voice_dialogue/api/app.py CHANGED Viewed

@@ -11,7 +11,7 @@ from .core.config import AppConfig
 from .core.lifespan import lifespan
 from .middleware.logging import LoggingMiddleware
 from .middleware.rate_limit import RateLimitMiddleware
-from .routes import tts_routes, asr_routes, system_routes, websocket_routes
 def create_app() -> FastAPI:
@@ -56,6 +56,7 @@ def _register_routes(app: FastAPI):
     v1_router.include_router(tts_routes.router, prefix="/tts", tags=["TTS模型管理"])
     v1_router.include_router(asr_routes.router, prefix="/asr", tags=["ASR模型管理"])
     v1_router.include_router(system_routes.router, prefix="/system", tags=["系统管理"])
     app.include_router(v1_router)
     app.add_websocket_route("/api/v1/ws", websocket_routes.ws)

 from .core.lifespan import lifespan
 from .middleware.logging import LoggingMiddleware
 from .middleware.rate_limit import RateLimitMiddleware
+from .routes import tts_routes, asr_routes, system_routes, websocket_routes, settings_routes
 def create_app() -> FastAPI:
     v1_router.include_router(tts_routes.router, prefix="/tts", tags=["TTS模型管理"])
     v1_router.include_router(asr_routes.router, prefix="/asr", tags=["ASR模型管理"])
     v1_router.include_router(system_routes.router, prefix="/system", tags=["系统管理"])
+    v1_router.include_router(settings_routes.router, prefix="/settings", tags=["设置管理"])
     app.include_router(v1_router)
     app.add_websocket_route("/api/v1/ws", websocket_routes.ws)

src/voice_dialogue/api/core/config.py CHANGED Viewed

@@ -64,13 +64,12 @@ class AppConfig:
         * **动态语言切换**: 运行时创建和切换不同语言的ASR实例
         ### 🤖 智能对话
-        * **大语言模型集成**: 基于Qwen2.5等先进模型
         * **上下文理解**: 支持多轮对话和上下文记忆
-        * **自定义系统提示**: 可配置AI助手的行为和角色
         ### 🎭 高质量语音合成 (TTS)
-        * **中文角色**: 基于GPT-SoVITs技术，支持罗翔、马保国、沈逸、杨幂、周杰伦、马云等特色角色
-        * **英文角色**: 基于Kokoro TTS技术，支持Heart、Bella、Nicole等自然语音
         * **智能引擎选择**: 根据内容语言自动选择最适合的TTS引擎
         * **动态角色管理**: 运行时加载、切换和管理语音角色
@@ -79,40 +78,47 @@ class AppConfig:
         * **状态监控**: 实时监控系统和模型状态
         * **会话管理**: 智能的会话ID管理和消息路由
-        ### 🔧 系统管理
         * **服务生命周期**: 完整的系统启动、停止、重启控制
         * **音频捕获**: 高质量的音频输入处理和回声消除
         * **状态监控**: 详细的服务状态和性能指标
         ## 📋 主要API端点
-        ### TTS模型管理
         * `GET /api/v1/tts/models` - 获取所有可用的TTS模型列表
         * `POST /api/v1/tts/models/load` - 加载指定的TTS模型
         * `GET /api/v1/tts/models/{model_id}/status` - 查看模型下载和加载状态
         * `DELETE /api/v1/tts/models/{model_id}` - 删除已下载的模型
-        ### 语音识别管理
         * `GET /api/v1/asr/languages` - 获取支持的识别语言列表
         * `POST /api/v1/asr/instance/create` - 创建指定语言的ASR实例
-        ### 系统控制
         * `GET /api/v1/system/status` - 获取系统整体状态
         * `POST /api/v1/system/start` - 启动语音对话系统
         * `POST /api/v1/system/stop` - 停止语音对话系统
         * `POST /api/v1/system/restart` - 重启语音对话系统
-        ### 实时通信
         * `WebSocket /api/v1/ws` - WebSocket连接，接收实时系统消息
         ## 🛠️ 技术特性
         * **异步处理**: 基于FastAPI的高性能异步架构
         * **后台任务**: 模型下载和加载在后台执行，不阻塞API响应
-        * **错误处理**: 完善的异常处理和错误信息反馈
-        * **状态管理**: 实时的模型和系统状态跟踪
-        * **CORS支持**: 跨域资源共享配置，便于前端集成
-        * **API文档**: 自动生成的交互式API文档
         ## 💡 使用场景

         * **动态语言切换**: 运行时创建和切换不同语言的ASR实例
         ### 🤖 智能对话
+        * **大语言模型集成**: 基于Qwen等先进模型
         * **上下文理解**: 支持多轮对话和上下文记忆
+        * **自定义系统提示**: 可配置AI助手的行为和角色，支持用户自定义
         ### 🎭 高质量语音合成 (TTS)
+        * **多角色支持**: 集成多种高质量TTS引擎，支持丰富的中英文角色
         * **智能引擎选择**: 根据内容语言自动选择最适合的TTS引擎
         * **动态角色管理**: 运行时加载、切换和管理语音角色
         * **状态监控**: 实时监控系统和模型状态
         * **会话管理**: 智能的会话ID管理和消息路由
+        ### 🔧 系统管理与设置
         * **服务生命周期**: 完整的系统启动、停止、重启控制
         * **音频捕获**: 高质量的音频输入处理和回声消除
         * **状态监控**: 详细的服务状态和性能指标
+        * **用户配置**: 支持用户通过API自定义和持久化应用设置
         ## 📋 主要API端点
+        ### 设置管理 (Settings)
+        * `GET /api/v1/settings/prompts` - 获取当前生效的系统Prompt
+        * `POST /api/v1/settings/prompts` - 更新并保存用户自定义的Prompt
+        * `DELETE /api/v1/settings/prompts` - 重置Prompt为系统默认值
+        * `GET /api/v1/settings/prompts/default` - 获取系统默认的Prompt
+        ### TTS模型管理 (TTS)
         * `GET /api/v1/tts/models` - 获取所有可用的TTS模型列表
         * `POST /api/v1/tts/models/load` - 加载指定的TTS模型
         * `GET /api/v1/tts/models/{model_id}/status` - 查看模型下载和加载状态
         * `DELETE /api/v1/tts/models/{model_id}` - 删除已下载的模型
+        ### 语音识别管理 (ASR)
         * `GET /api/v1/asr/languages` - 获取支持的识别语言列表
         * `POST /api/v1/asr/instance/create` - 创建指定语言的ASR实例
+        ### 系统控制 (System)
         * `GET /api/v1/system/status` - 获取系统整体状态
         * `POST /api/v1/system/start` - 启动语音对话系统
         * `POST /api/v1/system/stop` - 停止语音对话系统
         * `POST /api/v1/system/restart` - 重启语音对话系统
+        ### 实时通信 (WebSocket)
         * `WebSocket /api/v1/ws` - WebSocket连接，接收实时系统消息
         ## 🛠️ 技术特性
         * **异步处理**: 基于FastAPI的高性能异步架构
         * **后台任务**: 模型下载和加载在后台执行，不阻塞API响应
+        * **可配置性**: 支持用户通过API和配置文件自定义核心行为
+        * **持久化存储**: 用户设置可被持久化，重启应用后依然生效
+        * **内存缓存**: 缓存常用配置，减少磁盘I/O，提升性能
+        * **API文档**: 自动生成的交互式API文档(Swagger & ReDoc)
         ## 💡 使用场景

src/voice_dialogue/api/routes/__init__.py CHANGED Viewed

@@ -1,3 +1,3 @@
-from . import tts_routes, asr_routes, system_routes, websocket_routes
-__all__ = ["tts_routes", "asr_routes", "system_routes", "websocket_routes"]


1	+ from . import tts_routes, asr_routes, system_routes, websocket_routes, settings_routes
2
3	+ __all__ = ["tts_routes", "asr_routes", "system_routes", "websocket_routes", "settings_routes"]

src/voice_dialogue/api/routes/settings_routes.py ADDED Viewed

	@@ -0,0 +1,102 @@

+"""设置相关的API路由"""
+from typing import Optional
+from fastapi import APIRouter, HTTPException
+from pydantic import BaseModel, Field
+from voice_dialogue.config.llm_config import CHINESE_SYSTEM_PROMPT, ENGLISH_SYSTEM_PROMPT
+from voice_dialogue.config.user_config import (
+    get_user_prompts, save_user_prompts, get_raw_prompt, reset_prompts_to_default
+)
+router = APIRouter()
+class PromptsResponse(BaseModel):
+    """获取 Prompts 的响应模型"""
+    chinese_prompt: str = Field(..., description="中文系统提示词")
+    english_prompt: str = Field(..., description="英文系统提示词")
+    is_custom: bool = Field(..., description="是否为用户自定义")
+class UpdatePromptsRequest(BaseModel):
+    """更新 Prompts 的请求模型"""
+    chinese_prompt: Optional[str] = Field(None, description="中文系统提示词")
+    english_prompt: Optional[str] = Field(None, description="英文系统提示词")
+class DefaultPromptsResponse(BaseModel):
+    """默认 Prompts 的响应模型"""
+    chinese_prompt: str = Field(..., description="默认中文系统提示词")
+    english_prompt: str = Field(..., description="默认英文系统提示词")
+@router.get("/settings/prompts", response_model=PromptsResponse, summary="获取当前生效的 Prompt")
+async def get_current_prompts():
+    """
+    获取当前系统中正在使用的中文和英文系统 Prompt
+    返回的是原始内容，不包含系统自动添加的 /no_think 指令
+    """
+    user_prompts = get_user_prompts()
+    is_custom = bool(user_prompts)  # 如果有用户自定义配置，则认为是自定义的
+    return PromptsResponse(
+        chinese_prompt=get_raw_prompt("zh"),
+        english_prompt=get_raw_prompt("en"),
+        is_custom=is_custom
+    )
+@router.get("/settings/prompts/default", response_model=DefaultPromptsResponse, summary="获取默认 Prompt")
+async def get_default_prompts():
+    """获取系统默认的 Prompt（原始内容，不包含 /no_think）"""
+    return DefaultPromptsResponse(
+        chinese_prompt=CHINESE_SYSTEM_PROMPT,
+        english_prompt=ENGLISH_SYSTEM_PROMPT
+    )
+@router.post("/settings/prompts", summary="更新并保存用户的 Prompt 设置")
+async def update_user_prompts(request: UpdatePromptsRequest):
+    """
+    更新用户自定义的 Prompt
+    只更新请求体中提供的字段，未提供的字段将保持不变
+    """
+    try:
+        # 获取当前用户配置
+        current_prompts = get_user_prompts()
+        # 构建更新数据
+        update_data = request.model_dump(exclude_unset=True)
+        if not update_data:
+            raise HTTPException(status_code=400, detail="请求体不能为空")
+        # 更新配置
+        current_prompts.update(update_data)
+        # 保存配置
+        if not save_user_prompts(current_prompts):
+            raise HTTPException(status_code=500, detail="保存配置失败")
+        return {"message": "用户 Prompt 更新成功", "updated_fields": list(update_data.keys())}
+    except HTTPException:
+        raise
+    except Exception as e:
+        raise HTTPException(status_code=500, detail=f"更新 Prompt 失败: {str(e)}")
+@router.delete("/settings/prompts", summary="重置 Prompt 为默认值")
+async def reset_prompts():
+    """重置用户自定义的 Prompt 为系统默认值"""
+    try:
+        if not reset_prompts_to_default():
+            raise HTTPException(status_code=500, detail="重置失败")
+        return {"message": "Prompt 已重置为默认值"}
+    except HTTPException:
+        raise
+    except Exception as e:
+        raise HTTPException(status_code=500, detail=f"重置 Prompt 失败: {str(e)}")

src/voice_dialogue/config/llm_config.py CHANGED Viewed

@@ -1,9 +1,23 @@
 """LLM模型配置管理"""
 from typing import Dict, Any
 from voice_dialogue.utils.apple_silicon import get_optimal_llama_cpp_config, get_apple_silicon_info
-__all__ = ('get_llm_model_params', 'get_apple_silicon_summary')
 def get_llm_model_params() -> Dict[str, Any]:

 """LLM模型配置管理"""
 from typing import Dict, Any
 from voice_dialogue.utils.apple_silicon import get_optimal_llama_cpp_config, get_apple_silicon_info
+__all__ = ('get_llm_model_params', 'get_apple_silicon_summary', 'CHINESE_SYSTEM_PROMPT', 'ENGLISH_SYSTEM_PROMPT')
+CHINESE_SYSTEM_PROMPT = (
+    "你是AI助手。请以自然流畅的中文口语化表达直接回答问题，避免冗余的思考过程。"
+    "你的回答第一句话必须少于十个字。每段回答控制在二到三句话，既不要过短也不要过长，以适应对话语境。"
+    "回答应准确、精炼且有依据。"
+)
+ENGLISH_SYSTEM_PROMPT = (
+    "You are an AI assistant. "
+    "Please answer directly and naturally, using conversational English, without showing your thinking process. "
+    "Your first sentence must be less than 10 words. "
+    "Your responses should be accurate, concise, and well-supported, ideally around 2-3 sentences long to ensure a good conversational flow."
+)
 def get_llm_model_params() -> Dict[str, Any]:

src/voice_dialogue/config/paths.py CHANGED Viewed

@@ -1,3 +1,4 @@
 import sys
 from pathlib import Path
@@ -26,6 +27,27 @@ AUDIO_RESOURCES_PATH = ASSETS_PATH / "audio"
 FRONTEND_ASSETS_PATH = ASSETS_PATH / "www"
 def load_third_party():
     # 添加第三方库到 Python 路径
     if THIRD_PARTY_PATH.exists() and str(THIRD_PARTY_PATH) not in sys.path:

+import os
 import sys
 from pathlib import Path
 FRONTEND_ASSETS_PATH = ASSETS_PATH / "www"
+# 用户数据路径 - 根据操作系统选择合适的目录
+def get_app_data_path() -> Path:
+    """获取应用数据存储路径"""
+    app_name = "Voice Dialogue"
+    if sys.platform == "darwin":  # macOS
+        base_path = Path.home() / "Library" / "Application Support"
+    elif sys.platform == "win32":  # Windows
+        base_path = Path(os.environ.get("APPDATA", Path.home() / "AppData" / "Roaming"))
+    else:  # Linux and others
+        base_path = Path.home() / ".config"
+    return base_path / app_name
+APP_DATA_PATH = get_app_data_path()
+if not APP_DATA_PATH.exists():
+    APP_DATA_PATH.mkdir(parents=True, exist_ok=True)
+USER_PROMPTS_PATH = APP_DATA_PATH / "user_prompts.json"
 def load_third_party():
     # 添加第三方库到 Python 路径
     if THIRD_PARTY_PATH.exists() and str(THIRD_PARTY_PATH) not in sys.path:

src/voice_dialogue/config/user_config.py ADDED Viewed

	@@ -0,0 +1,128 @@

+"""用户配置管理模块"""
+import json
+from typing import Dict, Optional
+from .llm_config import CHINESE_SYSTEM_PROMPT, ENGLISH_SYSTEM_PROMPT
+from .paths import USER_PROMPTS_PATH
+from ..utils.logger import logger
+# 内存缓存，避免重复读取文件
+_user_prompts_cache: Optional[Dict[str, str]] = None
+def get_user_prompts() -> Dict[str, str]:
+    """
+    加载用户自定义的 prompts
+    Returns:
+        Dict[str, str]: 用户自定义的 prompts。
+    """
+    global _user_prompts_cache
+    if _user_prompts_cache is not None:
+        return _user_prompts_cache
+    if not USER_PROMPTS_PATH.exists():
+        logger.info(f"用户配置文件不存在，使用空配置: {USER_PROMPTS_PATH}")
+        _user_prompts_cache = {}
+        return _user_prompts_cache
+    try:
+        with open(USER_PROMPTS_PATH, 'r', encoding='utf-8') as f:
+            user_prompts = json.load(f)
+            logger.info("成功从文件加载用户自定义 prompts 到缓存")
+            _user_prompts_cache = user_prompts
+            return _user_prompts_cache
+    except (json.JSONDecodeError, IOError) as e:
+        logger.error(f"无法加载用户 prompt 配置文件，使用空配置: {e}")
+        _user_prompts_cache = {}
+        return _user_prompts_cache
+def save_user_prompts(prompts: Dict[str, str]) -> bool:
+    """
+    保存用户自定义的 prompts 到 JSON 文件，并更新缓存。
+    Args:
+        prompts: 要保存的 prompts 字典
+    Returns:
+        bool: 保存是否成功
+    """
+    global _user_prompts_cache
+    try:
+        # 确保目录存在
+        if not USER_PROMPTS_PATH.parent.exists():
+            USER_PROMPTS_PATH.parent.mkdir(parents=True, exist_ok=True)
+        with open(USER_PROMPTS_PATH, 'w', encoding='utf-8') as f:
+            json.dump(prompts, f, ensure_ascii=False, indent=4)
+        logger.info(f"用户 prompts 已保存到: {USER_PROMPTS_PATH}")
+        _user_prompts_cache = prompts  # 更新缓存
+        return True
+    except IOError as e:
+        logger.error(f"无法保存用户 prompt 配置文件: {e}")
+        return False
+def get_prompt(language: str) -> str:
+    """
+    获取指定语言的 prompt，并自动添加 /no_think 指令
+    优先从用户配置中获取，如果未配置，则返回默认值
+    Args:
+        language: 语言代码，"zh" 表示中文，其他表示英文
+    Returns:
+        str: 对应语言的系统提示词（已添加 /no_think）
+    """
+    user_prompts = get_user_prompts()
+    if language == "zh":
+        base_prompt = user_prompts.get("chinese_prompt", CHINESE_SYSTEM_PROMPT)
+    else:
+        base_prompt = user_prompts.get("english_prompt", ENGLISH_SYSTEM_PROMPT)
+    # 动态添加 /no_think 指令
+    # 检查是否已经包含 /no_think，避免重复添加
+    if "/no_think" not in base_prompt:
+        base_prompt = base_prompt.rstrip() + "\n/no_think"
+    return base_prompt
+def get_raw_prompt(language: str) -> str:
+    """
+    获取指定语言的原始 prompt（不添加 /no_think 指令）
+    用于API接口返回给前端显示
+    Args:
+        language: 语言代码，"zh" 表示中文，其他表示英文
+    Returns:
+        str: 对应语言的原始系统提示词
+    """
+    user_prompts = get_user_prompts()
+    if language == "zh":
+        return user_prompts.get("chinese_prompt", CHINESE_SYSTEM_PROMPT)
+    else:
+        return user_prompts.get("english_prompt", ENGLISH_SYSTEM_PROMPT)
+def reset_prompts_to_default() -> bool:
+    """
+    重置 prompts 为默认值，并清空缓存。
+    Returns:
+        bool: 重置是否成功
+    """
+    global _user_prompts_cache
+    try:
+        if USER_PROMPTS_PATH.exists():
+            USER_PROMPTS_PATH.unlink()
+            logger.info("用户自定义 prompts 已重置为默认值")
+        _user_prompts_cache = {}  # 重置缓存为空字典
+        return True
+    except IOError as e:
+        logger.error(f"重置 prompts 失败: {e}")
+        return False

src/voice_dialogue/services/audio/generator.py CHANGED Viewed

@@ -3,7 +3,7 @@ from multiprocessing import Queue
 from queue import Empty
 from voice_dialogue.core.base import BaseThread
-from voice_dialogue.core.constants import voice_state_manager, is_debug_mode
 from voice_dialogue.models.voice_task import VoiceTask
 from voice_dialogue.services.mixins import TaskStatusMixin
 from voice_dialogue.services.utils import has_no_words
@@ -83,14 +83,14 @@ class TTSAudioGenerator(BaseThread, TaskStatusMixin):
             return
         if not self.is_task_valid(voice_task):
             return
         if has_no_words(voice_task.answer_sentence):
             logger.info(f"跳过仅包含标点的文本: '{voice_task.answer_sentence}'")
             return
-        if is_debug_mode():
-            logger.info(f"TTS 音频生成: {voice_task.answer_sentence}")
         voice_task.tts_start_time = time.time()
         try:

 from queue import Empty
 from voice_dialogue.core.base import BaseThread
+from voice_dialogue.core.constants import voice_state_manager
 from voice_dialogue.models.voice_task import VoiceTask
 from voice_dialogue.services.mixins import TaskStatusMixin
 from voice_dialogue.services.utils import has_no_words
             return
         if not self.is_task_valid(voice_task):
+            logger.info(f"TTS 音频生成: 任务<{voice_task.id}> 无效")
             return
         if has_no_words(voice_task.answer_sentence):
             logger.info(f"跳过仅包含标点的文本: '{voice_task.answer_sentence}'")
             return
+        logger.info(f"TTS 音频生成: {voice_task.answer_sentence}")
         voice_task.tts_start_time = time.time()
         try:

src/voice_dialogue/services/audio/player.py CHANGED Viewed

@@ -9,7 +9,7 @@ from playsound import playsound
 from voice_dialogue.core.base import BaseThread
 from voice_dialogue.core.constants import (
-    voice_state_manager, silence_over_threshold_event, is_debug_mode
 )
 from voice_dialogue.models.voice_task import VoiceTask, AnswerDisplayMessage
 from voice_dialogue.services.mixins import TaskStatusMixin, HistoryMixin, PerformanceLogMixin
@@ -41,6 +41,7 @@ class AudioStreamPlayer(BaseThread, TaskStatusMixin, HistoryMixin, PerformanceLo
                 return  # 任务被中断，结束处理
             if not self.is_task_valid(voice_task):
                 return  # 任务无效，结束处理
             # 等待用户彻底静音的信号

 from voice_dialogue.core.base import BaseThread
 from voice_dialogue.core.constants import (
+    voice_state_manager, silence_over_threshold_event
 )
 from voice_dialogue.models.voice_task import VoiceTask, AnswerDisplayMessage
 from voice_dialogue.services.mixins import TaskStatusMixin, HistoryMixin, PerformanceLogMixin
                 return  # 任务被中断，结束处理
             if not self.is_task_valid(voice_task):
+                logger.info(f"音频播放: 任务<{voice_task.id}> 无效")
                 return  # 任务无效，结束处理
             # 等待用户彻底静音的信号

src/voice_dialogue/services/mixins.py CHANGED Viewed

@@ -13,16 +13,24 @@ class TaskStatusMixin:
     def is_task_interrupted(self, voice_task: VoiceTask) -> bool:
         """检查语音任务是否被其他任务中断"""
-        return (voice_state_manager.interrupt_task_id and
-                voice_task.id != voice_state_manager.interrupt_task_id)
     def is_task_valid(self, voice_task: VoiceTask) -> bool:
         """检查语音任务是否有效（会话匹配、未被丢弃等）"""
         if self.is_task_interrupted(voice_task):
             return False
         if voice_task.session_id != session_manager.current_id:
             return False
         if voice_task.answer_id in dropped_audio_cache:
             return False
         return True

     def is_task_interrupted(self, voice_task: VoiceTask) -> bool:
         """检查语音任务是否被其他任务中断"""
+        if not voice_state_manager.interrupt_task_id:
+            return False
+        if voice_task.id != voice_state_manager.interrupt_task_id:
+            logger.info(f"任务<{voice_task.id}> 被任务<{voice_state_manager.interrupt_task_id}> 中断")
+            return True
+        return False
     def is_task_valid(self, voice_task: VoiceTask) -> bool:
         """检查语音任务是否有效（会话匹配、未被丢弃等）"""
         if self.is_task_interrupted(voice_task):
             return False
         if voice_task.session_id != session_manager.current_id:
+            logger.info(f"任务<{voice_task.id}> 会话不匹配: {voice_task.session_id} != {session_manager.current_id}")
             return False
         if voice_task.answer_id in dropped_audio_cache:
+            logger.info(f"任务<{voice_task.id}> 被丢弃: {voice_task.answer_id}")
             return False
         return True

src/voice_dialogue/services/text/generator.py CHANGED Viewed

@@ -7,27 +7,15 @@ from langchain_core.chat_history import InMemoryChatMessageHistory
 from voice_dialogue.config import paths
 from voice_dialogue.config.llm_config import get_llm_model_params, get_apple_silicon_summary
 from voice_dialogue.core.base import BaseThread
 from voice_dialogue.core.constants import chat_history_cache
 from voice_dialogue.models.voice_task import VoiceTask, QuestionDisplayMessage
-from voice_dialogue.services.text.processor import preprocess_sentence_text, \
-    create_langchain_chat_llamacpp_instance, create_langchain_pipeline, warmup_langchain_pipeline
-from voice_dialogue.utils.logger import logger
-CHINESE_SYSTEM_PROMPT = (
-    "你是AI助手。请以自然流畅的中文口语化表达直接回答问题，避免冗余的思考过程。"
-    "你的回答第一句话必须少于十个字。每段回答控制在二到三句话，既不要过短也不要过长，以适应对话语境。"
-    "回答应准确、精炼且有依据。"
-    "/no_think"
-)
-ENGLISH_SYSTEM_PROMPT = (
-    "You are an AI assistant. "
-    "Please answer directly and naturally, using conversational English, without showing your thinking process. "
-    "Your first sentence must be less than 10 words. "
-    "Your responses should be accurate, concise, and well-supported, ideally around 2-3 sentences long to ensure a good conversational flow."
-    "/no_think"
 )
 class LLMResponseGenerator(BaseThread):
@@ -51,10 +39,7 @@ class LLMResponseGenerator(BaseThread):
     def _get_prompt_by_language(self, language: str) -> str:
         """根据语言获取对应的 prompt"""
-        if language == "zh":
-            return CHINESE_SYSTEM_PROMPT
-        else:
-            return ENGLISH_SYSTEM_PROMPT
     def get_session_history(self, session_id: str) -> InMemoryChatMessageHistory:
         message_history = InMemoryChatMessageHistory()
@@ -206,7 +191,9 @@ class LLMResponseGenerator(BaseThread):
         self.model_instance = create_langchain_chat_llamacpp_instance(
             local_model_path=model_path, model_params=model_params
         )
-        pipeline = create_langchain_pipeline(self.model_instance, CHINESE_SYSTEM_PROMPT, self.get_session_history)
         warmup_langchain_pipeline(pipeline)
         self.is_ready = True

 from voice_dialogue.config import paths
 from voice_dialogue.config.llm_config import get_llm_model_params, get_apple_silicon_summary
+from voice_dialogue.config.user_config import get_prompt
 from voice_dialogue.core.base import BaseThread
 from voice_dialogue.core.constants import chat_history_cache
 from voice_dialogue.models.voice_task import VoiceTask, QuestionDisplayMessage
+from voice_dialogue.services.text.processor import (
+    preprocess_sentence_text, create_langchain_chat_llamacpp_instance,
+    create_langchain_pipeline, warmup_langchain_pipeline
 )
+from voice_dialogue.utils.logger import logger
 class LLMResponseGenerator(BaseThread):
     def _get_prompt_by_language(self, language: str) -> str:
         """根据语言获取对应的 prompt"""
+        return get_prompt(language)
     def get_session_history(self, session_id: str) -> InMemoryChatMessageHistory:
         message_history = InMemoryChatMessageHistory()
         self.model_instance = create_langchain_chat_llamacpp_instance(
             local_model_path=model_path, model_params=model_params
         )
+        # 使用默认中文 prompt 进行 warmup
+        prompt = get_prompt("zh")
+        pipeline = create_langchain_pipeline(self.model_instance, prompt, self.get_session_history)
         warmup_langchain_pipeline(pipeline)
         self.is_ready = True

tests/test_llm_dialogue.py CHANGED Viewed

@@ -31,6 +31,12 @@ ENGLISH_SYSTEM_PROMPT = (
     "/no_think"
 )
 class TestLLMDialogue(unittest.TestCase):

     "/no_think"
 )
+if not CHINESE_SYSTEM_PROMPT:
+    from voice_dialogue.config.llm_config import CHINESE_SYSTEM_PROMPT
+if not ENGLISH_SYSTEM_PROMPT:
+    from voice_dialogue.config.llm_config import ENGLISH_SYSTEM_PROMPT
 class TestLLMDialogue(unittest.TestCase):