ttsedge / README.md
chaore's picture
Upload README.md
8a2256c verified

A newer version of the Gradio SDK is available: 6.9.0

Upgrade
metadata
title: Edge TTS API
emoji: 📢
colorFrom: blue
colorTo: purple
sdk: gradio
app_file: gradio_app.py
pinned: false
short_description: 基于Edge TTS的文本转语音API服务

Edge TTS 配音工具

一个基于Edge TTS的文本转语音API服务,可部署在Hugging Face上。

功能特性

  • 支持多种语音(包括中文、英文等)
  • 可调整语速和音量
  • 提供RESTful API接口
  • 流式输出音频
  • 支持多种语言和方言

API 接口

POST /tts

文本转语音接口

请求体:

{
  "text": "要转换的文本",
  "voice": "语音名称(默认:zh-CN-YunxiNeural)",
  "rate": "语速调整(默认:+0%)",
  "volume": "音量调整(默认:+0%)"
}

响应:

  • 音频流(MP3格式)

GET /voices

获取所有可用语音列表

响应:

[
  {
    "short_name": "语音名称",
    "friendly_name": "友好名称",
    "gender": "性别",
    "locale": "语言区域"
  }
]

部署到Hugging Face

步骤

  1. 登录Hugging Face账号

  2. 创建新的Space

    • 点击右上角的"+"按钮,选择"New Space"
    • 输入Space名称
    • 选择Space可见性(公开或私有)
  3. 配置Space设置

    • 选择"App"类型
    • 选择"Python"作为SDK
    • 选择最新的Python版本
  4. 上传文件

    • 上传以下文件到Space:
      • gradio_app.py - 主应用代码
      • requirements.txt - 依赖列表
      • README.md - 项目说明文档
  5. 部署

环境要求

  • Python 3.10+
  • 网络连接(Edge TTS需要访问Microsoft Edge的TTS服务)

部署后测试

部署完成后,可以通过以下方式测试API:

  1. 访问API文档

  2. 测试TTS功能

    curl -X POST "https://your-username-your-space-name.hf.space/tts" \
         -H "Content-Type: application/json" \
         -d '{"text": "Hello world", "voice": "en-US-JennyNeural"}' \
         -o output.mp3
    

注意事项

  • 确保Space有足够的资源(Edge TTS可能需要一定的内存和CPU)
  • 由于Edge TTS需要访问外部服务,部署在某些受限网络环境中可能无法正常工作
  • 如果遇到网络问题,可以尝试使用VPN或检查网络防火墙设置

本地测试

pip install -r requirements.txt
python gradio_app.py

访问 http://localhost:7860 查看Gradio界面

可用语音示例

  • 中文:zh-CN-YunxiNeural, zh-CN-YunxiaoNeural, zh-CN-YunyangNeural
  • 英文:en-US-JennyNeural, en-US-GuyNeural
  • 其他语言:请通过/voices接口获取完整列表

调整参数说明

  • voice:语音名称
  • rate:语速,如"+10%"(加快10%)或"-10%"(减慢10%)
  • volume:音量,如"+10%"(增加10%)或"-10%"(减少10%)

许可证

MIT