Spaces:

Ane4ka
/

NoteMaker

Sleeping

NoteMaker / README.md

ASureevaA

edit

09aa316 5 months ago

1.21 kB

NoteMaker

Проект представляет собой систему, которая принимает на вход изображение с английским текстом и последовательно выполняет три шага:

Распознавание текста выполняется EasyOCR.

Распознанный текст подаётся в модель distilbert-base-uncased-finetuned-sst-2-english для определения тональности.

Для сжатия текста до конспекта используется модель sshleifer/distilbart-cnn-12-6.

Полученный конспект передаётся в модель facebook/mms-tts-eng (VITS), которая генерирует аудио в формате WAV.