marry1908 commited on
Commit
7147b26
·
verified ·
1 Parent(s): a123d2f

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +59 -5
README.md CHANGED
@@ -1,12 +1,66 @@
1
  ---
2
- title: Topic Classification
3
- emoji: 👁
4
- colorFrom: pink
5
  colorTo: purple
6
  sdk: gradio
7
- sdk_version: 6.5.1
8
  app_file: app.py
9
  pinned: false
10
  ---
11
 
12
- Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
  ---
2
+ title: Тематический классификатор текста
3
+ emoji: 🏷️
4
+ colorFrom: blue
5
  colorTo: purple
6
  sdk: gradio
7
+ sdk_version: "4.0.0"
8
  app_file: app.py
9
  pinned: false
10
  ---
11
 
12
+ # 🏷️ Тематический классификатор текста
13
+
14
+ Веб-приложение для автоматической классификации текстов по темам с использованием нейронных сетей. Определяет основную тему текста из 12 возможных категорий.
15
+
16
+ ## 🚀 Живая демонстрация
17
+ [![Open in Spaces](https://huggingface.co/datasets/huggingface/badges/raw/main/open-in-hf-spaces-sm-dark.svg)](https://huggingface.co/spaces/marry1908/Extracting-entities)
18
+
19
+ ## 📌 Возможности приложения
20
+
21
+ ### ✅ Основные функции
22
+ - **Автоматическое определение** темы текста
23
+ - **12 тематических категорий:** спорт, политика, наука и другие
24
+ - **Визуализация результатов** с прогресс-барами
25
+ - **История запросов** (последние 10 запросов)
26
+ - **Настройка количества** отображаемых тем (1-5)
27
+ - **Измерение времени** обработки
28
+ - **Готовые примеры** для быстрого тестирования
29
+
30
+ ### 🎯 Определяемые темы
31
+ | Тема | Иконка | Описание | Пример текста |
32
+ |------|--------|----------|---------------|
33
+ | **Спорт** | 🏀 | Спортивные события, соревнования, команды | "Сборная России выиграла чемпионат мира по хоккею" |
34
+ | **Политика** | 🏛️ | Политические новости, выборы, законы | "Парламент принял новый закон о налогах" |
35
+ | **Наука** | 🔬 | Научные открытия, исследования, технологии | "Учёные открыли новый вид динозавров" |
36
+ | **Технологии** | 💻 | IT, гаджеты, программы, интернет | "Apple представила новый iPhone 15" |
37
+ | **Здоровье** | 🏥 | Медицина, болезни, лечение, ЗОЖ | "Врачи нашли новое лекарство от рака" |
38
+ | **Образование** | 📚 | Школы, вузы, обучение, экзамены | "Министерство образования изменило правила ЕГЭ" |
39
+ | **Культура** | 🎭 | Искусство, музыка, кино, литература | "В Эрмитаже открылась выставка Ван Гога" |
40
+ | **Экономика** | 💰 | Финансы, бизнес, рынки, кризисы | "Цены на нефть выросли на 10%" |
41
+ | **Путешествия** | ✈️ | Туризм, страны, достопримечательности | "Турция стала самым популярным курортом" |
42
+ | **Развлечения** | 🎬 | Фильмы, сериалы, игры, шоу | "Вышел новый сезон Игры престолов" |
43
+ | **Погода** | ☀️ | Климат, температура, природные явления | "Завтра ожидается снегопад и метель" |
44
+ | **Происшествия** | 🚨 | Аварии, катастрофы, криминал | "В Москве произошло серьёзное ДТП" |
45
+
46
+ ## 🧠 Используемая модель
47
+
48
+ ### **Модель:** `facebook/bart-large-mnli`
49
+
50
+ ### **Почему выбрана эта модель:**
51
+ 1. **Zero-shot классификация** - не требует предварительного обучения на конкретных темах
52
+ 2. **Мультиязычная поддержка** - работает с русским и английским языками
53
+ 3. **Высокая точность** - показывает хорошие результаты на разнообразных текстах
54
+ 4. **Гибкость** - можно легко добавлять новые темы без переобучения
55
+ 5. **Оптимизирована для CPU** - достаточно быстрая для веб-приложения
56
+
57
+ ### **Принцип работы:**
58
+ Модель использует технику **zero-shot классификации**, что означает:
59
+ - Не нужен предварительно размеченный датасет
60
+ - Можно задавать любые темы на лету
61
+ - Модель определяет, насколько текс�� соответствует каждой теме
62
+
63
+ ## 📊 Примеры работы
64
+
65
+ ### Пример 1: Спортивный текст
66
+ **Входной текст:**