Spaces:

chaore
/

ttsedge

Sleeping

App Files Files Community

ttsedge / README.md

chaore

Upload README.md

8a2256c verified 2 months ago

preview code

raw

history blame contribute delete

3.12 kB

A newer version of the Gradio SDK is available: 6.9.0

Upgrade

metadata

title: Edge TTS API
emoji: 📢
colorFrom: blue
colorTo: purple
sdk: gradio
app_file: gradio_app.py
pinned: false
short_description: 基于Edge TTS的文本转语音API服务

Edge TTS 配音工具

一个基于Edge TTS的文本转语音API服务，可部署在Hugging Face上。

功能特性

支持多种语音（包括中文、英文等）
可调整语速和音量
提供RESTful API接口
流式输出音频
支持多种语言和方言

API 接口

POST /tts

文本转语音接口

请求体：

{
  "text": "要转换的文本",
  "voice": "语音名称（默认：zh-CN-YunxiNeural）",
  "rate": "语速调整（默认：+0%）",
  "volume": "音量调整（默认：+0%）"
}

响应：

音频流（MP3格式）

GET /voices

获取所有可用语音列表

响应：

[
  {
    "short_name": "语音名称",
    "friendly_name": "友好名称",
    "gender": "性别",
    "locale": "语言区域"
  }
]

部署到Hugging Face

步骤

登录Hugging Face账号
- 访问 https://huggingface.co/ 并登录
创建新的Space
- 点击右上角的"+"按钮，选择"New Space"
- 输入Space名称
- 选择Space可见性（公开或私有）
配置Space设置
- 选择"App"类型
- 选择"Python"作为SDK
- 选择最新的Python版本
上传文件
- 上传以下文件到Space：
  - gradio_app.py - 主应用代码
  - requirements.txt - 依赖列表
  - README.md - 项目说明文档
部署
- 点击"Create Space"按钮
- Hugging Face会自动安装依赖并启动应用
- 部署完成后，访问提供的URL（格式：https://your-username-your-space-name.hf.space）

环境要求

Python 3.10+
网络连接（Edge TTS需要访问Microsoft Edge的TTS服务）

部署后测试

部署完成后，可以通过以下方式测试API：

访问API文档
- 访问 https://your-username-your-space-name.hf.space/docs
- 使用交互式文档测试API功能

测试TTS功能

curl -X POST "https://your-username-your-space-name.hf.space/tts" \
     -H "Content-Type: application/json" \
     -d '{"text": "Hello world", "voice": "en-US-JennyNeural"}' \
     -o output.mp3

注意事项

确保Space有足够的资源（Edge TTS可能需要一定的内存和CPU）
由于Edge TTS需要访问外部服务，部署在某些受限网络环境中可能无法正常工作
如果遇到网络问题，可以尝试使用VPN或检查网络防火墙设置

本地测试

pip install -r requirements.txt
python gradio_app.py

访问 http://localhost:7860 查看Gradio界面

可用语音示例

中文：zh-CN-YunxiNeural, zh-CN-YunxiaoNeural, zh-CN-YunyangNeural
英文：en-US-JennyNeural, en-US-GuyNeural
其他语言：请通过/voices接口获取完整列表

调整参数说明

voice：语音名称
rate：语速，如"+10%"（加快10%）或"-10%"（减慢10%）
volume：音量，如"+10%"（增加10%）或"-10%"（减少10%）

许可证

MIT