Ulyha commited on
Commit
da987af
·
verified ·
1 Parent(s): 0dc0529

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +10 -115
README.md CHANGED
@@ -1,117 +1,12 @@
1
- # 🎙️ Voice Message Analyzer
2
-
3
- Умный анализатор голосовых сообщений с использованием трех трансформеров для автоматической обработки аудио.
4
-
5
- ## 🎯 Применение
6
-
7
- Идеально подходит для:
8
- - **Менеджеров** - быстрая обработка голосовых сообщений клиентов
9
- - **Службы поддержки** - автоматическая категоризация обращений
10
- - **Колл-центров** - анализ записей разговоров
11
- - **Студентов** - создание конспектов из лекций
12
-
13
- ## 🔄 Как это работает
14
-
15
- ```
16
- Аудио файл → Транскрипция → Краткая выжимка → Категоризация темы
17
- ```
18
-
19
- ### Этап 1: Speech-to-Text (Транскрипция)
20
- Преобразует голосовое сообщение в текст с помощью OpenAI Whisper
21
-
22
- ### Этап 2: Summarization (Краткая выжимка)
23
- Создает краткое содержание транскрипции (2-3 предложения)
24
-
25
- ### Этап 3: Classification (Определение темы)
26
- Автоматически определяет категорию обращения:
27
- - Жалоба / Проблема
28
- - Вопрос / Запрос информации
29
- - Благодарность
30
- - Заказ / Покупка
31
- - Техническая поддержка
32
- - Доставка / Логистика
33
- - Финансы / Оплата
34
- - Общий разговор
35
-
36
- ## 🤖 Используемые модели
37
-
38
- 1. **OpenAI Whisper-small** - Транскрипция (3.4M загрузок)
39
- 2. **Falconsai/text_summarization** - Суммаризация
40
- 3. **Facebook BART-large-mnli** - Zero-shot классификация
41
-
42
- ## 💻 Локальная установка
43
-
44
- ```bash
45
- pip install -r requirements.txt
46
- python app.py
47
- ```
48
-
49
- ## 🚀 Деплой на Hugging Face Spaces
50
-
51
- 1. Создайте новый Space (Gradio SDK)
52
- 2. Загрузите `app.py` и `requirements.txt`
53
- 3. Выберите GPU (рекомендуется T4 small для быстрой работы)
54
- 4. Дождитесь сборки (~3-5 минут)
55
-
56
- ## 📊 Производительность
57
-
58
- - **CPU Basic (бесплатно)**: 30-60 секунд на аудио
59
- - **GPU T4 small**: 5-10 секунд на аудио
60
- - **Первый запуск**: Модели скачиваются (~2 GB)
61
-
62
- ## 🎤 Поддерживаемые форматы
63
-
64
- - Форматы: WAV, MP3, M4A, FLAC
65
- - Длительность: 10 секунд - 5 минут
66
- - Языки: Английский (лучшие результаты), русский и другие
67
-
68
- ## 📝 Примеры использования
69
-
70
- ### Для службы поддержки:
71
- ```
72
- Аудио: "Hi, I ordered a laptop 3 days ago but it hasn't arrived yet..."
73
- → Транскрипция: Полный текст
74
- → Выжимка: "Customer ordered laptop 3 days ago, hasn't received it"
75
- → Категория: Доставка / Логистика (95%)
76
- ```
77
-
78
- ### Для менеджеров:
79
- ```
80
- Аудио: "I'm interested in your premium subscription..."
81
- → Транскрипция: Полный текст
82
- → Выжимка: "Customer inquiring about premium subscription details"
83
- → Категория: Вопрос / Запрос информации (87%)
84
- ```
85
-
86
- ## ⚙️ Настройка категорий
87
-
88
- Вы можете легко изменить список категорий в `app.py`:
89
-
90
- ```python
91
- CATEGORIES = [
92
- "Ваша категория 1",
93
- "Ваша категория 2",
94
- # ... добавьте свои
95
- ]
96
- ```
97
-
98
- ## 🔧 Улучшения
99
-
100
- Возможные улучшения проекта:
101
- - Добавить поддержку multiple языков
102
- - Sentiment analysis для определения эмоций
103
- - Экспорт результатов в CSV/Excel
104
- - История обработанных сообщений
105
- - API для интеграции с другими системами
106
-
107
- ## 📄 Лицензия
108
-
109
- Используемые модели имеют открытые лицензии (Apache 2.0, MIT)
110
-
111
- ## 🤝 Вклад
112
-
113
- Pull requests приветствуются! Для крупных изменений сначала откройте issue.
114
-
115
  ---
116
 
117
- **Создано для учебного проекта по трансформерам**
 
1
+ ---
2
+ title: 3-transformers
3
+ emoji:
4
+ colorFrom: purple
5
+ colorTo: indigo
6
+ sdk: gradio
7
+ sdk_version: 6.1.0
8
+ app_file: app.py
9
+ pinned: false
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
10
  ---
11
 
12
+ Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference