VoxCPM 0.5B: Русская версия (Fine-Tuned)

Это модель VoxCPM 0.5B, прошедшая полное дообучение (Full Fine-Tuning) на русскоязычном корпусе речи. Модель адаптирует архитектуру VoxCPM (tokenizer-free) для синтеза качественной русской речи.

Шаг чекпоинта: 5600

Установка

Убедитесь, что у вас установлен пакет voxcpm (из репозитория VoxCPM):

git clone https://github.com/OpenBMB/VoxCPM.git
cd VoxCPM
pip install -e .

Использование

Модель обучена генерировать русскую речь определенным голосом. Для получения наилучшего результата рекомендуется использовать стандартный режим генерации без подмены голоса (клонирования).

Пример кода на Python

import soundfile as sf
from voxcpm import VoxCPM

# Загрузка модели
# Модель будет автоматически скачана из Hugging Face
model = VoxCPM.from_pretrained("ALEKAS/VoxCPM-0.5B-Russian-5600", load_denoiser=False)

# Текст для озвучивания
text = "Привет! Это пример синтеза речи на русском языке с использованием модели VoxCPM."

# Генерируем аудио
# Важно: prompt_wav_path=None, чтобы модель говорила своим "родным" обученным голосом
wav = model.generate(text, prompt_wav_path=None)

# Сохраняем результат
sample_rate = model.tts_model.sample_rate
sf.write("output.wav", wav, sample_rate)
print(f"Файл output.wav сохранен с частотой {sample_rate}Гц")

Downloads last month: 20

Safetensors

Model size

0.7B params

Tensor type

F32