File size: 1,449 Bytes
ee1c221 09aa316 d05a6fe 09aa316 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 |
---
title: NoteMaker
emoji: 🏢
colorFrom: blue
colorTo: yellow
sdk: gradio
sdk_version: 6.0.2
app_file: app.py
pinned: false
short_description: Make your own notes
---
# NoteMaker
## Краткое описание
Проект представляет собой систему, которая принимает на вход изображение с английским текстом
и последовательно выполняет три шага:
- распознавание текста,
- анализ тональности текста,
- составление сжатого конспекта,
- озвучивание полученного конспекта.
## Архитектура системы

## Использованные модели
Распознавание текста выполняется **EasyOCR**.
Распознанный текст подаётся в модель **distilbert-base-uncased-finetuned-sst-2-english** для определения тональности.
Для сжатия текста до конспекта используется модель **sshleifer/distilbart-cnn-12-6**.
Полученный конспект передаётся в модель **facebook/mms-tts-eng (VITS)**, которая генерирует аудио в формате WAV.
|