音色设计指南（Voice Design README）

概述

本指南用于创建高质量的声音描述（voice_prompt），帮助生成符合特定需求的理想音色。声音描述是声音设计的蓝图，直接决定模型输出的音色质量。

项目	说明
长度限制	单个 voice_prompt ≤ 200 个字符
支持语言	中文，当前版本暂不支持英文，后续会更新

✅ 正确做法：使用可感知的声音特质词

❌ 错误示例："好听"、"普通"、"不错"（过于主观，缺乏信息量）

✅ 正确做法：至少组合3-4个维度构建立体声像

❌ 错误示例：仅"女声"或仅"低沉"（过于宽泛，特色不鲜明）

✅ 正确做法：描述声音物理特征

❌ 错误示例："我最喜欢的声音"、"这个声音很棒"

⚠️ 版权风险：禁止使用"模仿XX明星"、"像XX演员"等描述 ✅ 正确做法：描述声音特质本身，而非特定人物

✅ 正确做法：每个词都承载信息 ❌ 错误示例："非常非常棒的声音"、"极其极其温柔"

基于优秀案例，建议从以下维度组合描述：

案例1：诗歌朗诵

"一位男性现代诗朗诵者，用深沉磁性的低音，以顿挫有力的节奏演绎艾青诗歌，音量洪亮，情感激昂澎湃。"

案例2：新闻风格

"这是一位女性新闻主播，用标准普通话以清晰明亮的中高音，以平稳专业的语速播报时事新闻，音量洪亮，情感客观中立。"

案例3：广告配音

"这是一位男性白酒品牌广告配音，用沧桑浑厚的嗓音，以缓慢而豪迈的语速，音量洪亮，传递历史底蕴和男人情怀。"

在提交 voice_prompt 前，请确认：