ttsgenie

Sleeping

File size: 3,022 Bytes

4cf4281
a287c67
 
 
 
4cf4281
 
a287c67
4cf4281
 
a287c67

---
title: Genie-TTS OpenAI Compatible API
emoji: 🔮
colorFrom: purple
colorTo: blue
sdk: docker
pinned: false
license: mit
---

# 🔮 Genie-TTS OpenAI Compatible API

基于 [Genie-TTS](https://github.com/High-Logic/Genie-TTS) 的 OpenAI 兼容 TTS API 服务。

## 🚀 功能特点

- ✅ **OpenAI API 兼容** - 使用 `/v1/audio/speech` 端点，兼容 OpenAI SDK
- ✅ **高质量语音合成** - 基于 GPT-SoVITS V2ProPlus 模型
- ✅ **中文支持** - 目前支持中文语音合成
- ✅ **WAV 输出** - 32kHz 高质量音频输出

## 📖 API 使用方法

### 端点

```
POST /v1/audio/speech
```

### 请求格式

```json
{
    "model": "liang",
    "input": "你好，这是一段测试文本。"
}
```

### 请求参数

| 参数 | 类型 | 必需 | 说明 |
|------|------|------|------|
| `model` | string | ✅ | 语音模型名称 |
| `input` | string | ✅ | 要合成的文本 |
| `voice` | string | ❌ | 忽略 - 仅用于 OpenAI 兼容性 |
| `response_format` | string | ❌ | 忽略 - 只支持 wav |
| `speed` | number | ❌ | 忽略 - 仅用于 OpenAI 兼容性 |

### 响应

- Content-Type: `audio/wav`
- 返回 WAV 格式的音频二进制数据

## 💻 使用示例

### 使用 curl

```bash
curl -X POST "https://your-space.hf.space/v1/audio/speech" \
  -H "Content-Type: application/json" \
  -d '{"model": "liang", "input": "你好，欢迎使用语音合成服务。"}' \
  --output speech.wav
```

### 使用 Python requests

```python
import requests

response = requests.post(
    "https://your-space.hf.space/v1/audio/speech",
    json={
        "model": "liang",
        "input": "你好，这是一段测试文本。"
    }
)

with open("speech.wav", "wb") as f:
    f.write(response.content)
```

### 使用 OpenAI Python SDK

```python
from openai import OpenAI

client = OpenAI(
    api_key="not-needed",  # API key 不需要
    base_url="https://your-space.hf.space/v1"
)

response = client.audio.speech.create(
    model="liang",
    input="你好，这是一段测试文本。",
    voice="alloy"  # 会被忽略
)

response.stream_to_file("speech.wav")
```

## 🔧 其他端点

### 健康检查

```
GET /health
```

响应:
```json
{
    "status": "healthy",
    "models_loaded": 1,
    "available_models": ["liang"]
}
```

### 列出可用模型

```
GET /v1/models
```

响应:
```json
{
    "object": "list",
    "data": [
        {
            "id": "liang",
            "object": "model",
            "created": 1234567890,
            "owned_by": "genie-tts"
        }
    ]
}
```

## 📝 可用模型

| 模型名称 | 语言 | 说明 |
|----------|------|------|
| `liang` | 中文 | GPT-SoVITS V2ProPlus 模型 |

## ⚠️ 注意事项

1. 首次加载可能需要一些时间
2. 免费版 CPU 推理可能较慢
3. 音频输出固定为 WAV 格式 (32kHz, 16-bit, 单声道)

## 🔗 相关链接

- [Genie-TTS GitHub](https://github.com/High-Logic/Genie-TTS)
- [GPT-SoVITS](https://github.com/RVC-Boss/GPT-SoVITS)

## 📄 许可证

MIT License