Spaces:
Sleeping
Sleeping
Update README.md
Browse files
README.md
CHANGED
|
@@ -1,12 +1,66 @@
|
|
| 1 |
---
|
| 2 |
-
title:
|
| 3 |
-
emoji:
|
| 4 |
-
colorFrom:
|
| 5 |
colorTo: purple
|
| 6 |
sdk: gradio
|
| 7 |
-
sdk_version:
|
| 8 |
app_file: app.py
|
| 9 |
pinned: false
|
| 10 |
---
|
| 11 |
|
| 12 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
---
|
| 2 |
+
title: Тематический классификатор текста
|
| 3 |
+
emoji: 🏷️
|
| 4 |
+
colorFrom: blue
|
| 5 |
colorTo: purple
|
| 6 |
sdk: gradio
|
| 7 |
+
sdk_version: "4.0.0"
|
| 8 |
app_file: app.py
|
| 9 |
pinned: false
|
| 10 |
---
|
| 11 |
|
| 12 |
+
# 🏷️ Тематический классификатор текста
|
| 13 |
+
|
| 14 |
+
Веб-приложение для автоматической классификации текстов по темам с использованием нейронных сетей. Определяет основную тему текста из 12 возможных категорий.
|
| 15 |
+
|
| 16 |
+
## 🚀 Живая демонстрация
|
| 17 |
+
[](https://huggingface.co/spaces/marry1908/Extracting-entities)
|
| 18 |
+
|
| 19 |
+
## 📌 Возможности приложения
|
| 20 |
+
|
| 21 |
+
### ✅ Основные функции
|
| 22 |
+
- **Автоматическое определение** темы текста
|
| 23 |
+
- **12 тематических категорий:** спорт, политика, наука и другие
|
| 24 |
+
- **Визуализация результатов** с прогресс-барами
|
| 25 |
+
- **История запросов** (последние 10 запросов)
|
| 26 |
+
- **Настройка количества** отображаемых тем (1-5)
|
| 27 |
+
- **Измерение времени** обработки
|
| 28 |
+
- **Готовые примеры** для быстрого тестирования
|
| 29 |
+
|
| 30 |
+
### 🎯 Определяемые темы
|
| 31 |
+
| Тема | Иконка | Описание | Пример текста |
|
| 32 |
+
|------|--------|----------|---------------|
|
| 33 |
+
| **Спорт** | 🏀 | Спортивные события, соревнования, команды | "Сборная России выиграла чемпионат мира по хоккею" |
|
| 34 |
+
| **Политика** | 🏛️ | Политические новости, выборы, законы | "Парламент принял новый закон о налогах" |
|
| 35 |
+
| **Наука** | 🔬 | Научные открытия, исследования, технологии | "Учёные открыли новый вид динозавров" |
|
| 36 |
+
| **Технологии** | 💻 | IT, гаджеты, программы, интернет | "Apple представила новый iPhone 15" |
|
| 37 |
+
| **Здоровье** | 🏥 | Медицина, болезни, лечение, ЗОЖ | "Врачи нашли новое лекарство от рака" |
|
| 38 |
+
| **Образование** | 📚 | Школы, вузы, обучение, экзамены | "Министерство образования изменило правила ЕГЭ" |
|
| 39 |
+
| **Культура** | 🎭 | Искусство, музыка, кино, литература | "В Эрмитаже открылась выставка Ван Гога" |
|
| 40 |
+
| **Экономика** | 💰 | Финансы, бизнес, рынки, кризисы | "Цены на нефть выросли на 10%" |
|
| 41 |
+
| **Путешествия** | ✈️ | Туризм, страны, достопримечательности | "Турция стала самым популярным курортом" |
|
| 42 |
+
| **Развлечения** | 🎬 | Фильмы, сериалы, игры, шоу | "Вышел новый сезон Игры престолов" |
|
| 43 |
+
| **Погода** | ☀️ | Климат, температура, природные явления | "Завтра ожидается снегопад и метель" |
|
| 44 |
+
| **Происшествия** | 🚨 | Аварии, катастрофы, криминал | "В Москве произошло серьёзное ДТП" |
|
| 45 |
+
|
| 46 |
+
## 🧠 Используемая модель
|
| 47 |
+
|
| 48 |
+
### **Модель:** `facebook/bart-large-mnli`
|
| 49 |
+
|
| 50 |
+
### **Почему выбрана эта модель:**
|
| 51 |
+
1. **Zero-shot классификация** - не требует предварительного обучения на конкретных темах
|
| 52 |
+
2. **Мультиязычная поддержка** - работает с русским и английским языками
|
| 53 |
+
3. **Высокая точность** - показывает хорошие результаты на разнообразных текстах
|
| 54 |
+
4. **Гибкость** - можно легко добавлять новые темы без переобучения
|
| 55 |
+
5. **Оптимизирована для CPU** - достаточно быстрая для веб-приложения
|
| 56 |
+
|
| 57 |
+
### **Принцип работы:**
|
| 58 |
+
Модель использует технику **zero-shot классификации**, что означает:
|
| 59 |
+
- Не нужен предварительно размеченный датасет
|
| 60 |
+
- Можно задавать любые темы на лету
|
| 61 |
+
- Модель определяет, насколько текс�� соответствует каждой теме
|
| 62 |
+
|
| 63 |
+
## 📊 Примеры работы
|
| 64 |
+
|
| 65 |
+
### Пример 1: Спортивный текст
|
| 66 |
+
**Входной текст:**
|