Spaces:
Sleeping
Sleeping
Update app.py
Browse files
app.py
CHANGED
|
@@ -4,36 +4,33 @@ import time
|
|
| 4 |
import pandas as pd
|
| 5 |
from datetime import datetime
|
| 6 |
|
| 7 |
-
# Загружаем модель для тематической классификации
|
| 8 |
-
|
| 9 |
-
# Альтернатива: "cointegrated/LaBSE-en-ru" или ищем модель специально для topic classification
|
| 10 |
-
|
| 11 |
-
# Пока возьмём мультиязычную модель для демонстрации
|
| 12 |
classifier = pipeline("zero-shot-classification",
|
| 13 |
model="facebook/bart-large-mnli",
|
| 14 |
-
device=-1) # CPU
|
| 15 |
|
| 16 |
-
# Предопределённые темы для классификации
|
| 17 |
PREDEFINED_TOPICS = [
|
| 18 |
"спорт", "политика", "наука", "технологии",
|
| 19 |
"здоровье", "образование", "культура", "экономика",
|
| 20 |
"путешествия", "развлечения", "погода", "происшествия"
|
| 21 |
]
|
| 22 |
|
| 23 |
-
# Словарь для расшифровки тем на русский
|
| 24 |
TOPIC_DESCRIPTIONS = {
|
| 25 |
-
"спорт": "🏀 Спорт
|
| 26 |
-
"политика": "🏛️ Политика
|
| 27 |
-
"наука": "🔬 Наука
|
| 28 |
-
"технологии": "💻 Технологии
|
| 29 |
-
"здоровье": "🏥 Здоровье
|
| 30 |
-
"образование": "📚 Образование
|
| 31 |
-
"культура": "🎭 Культура
|
| 32 |
-
"экономика": "💰 Экономика
|
| 33 |
-
"путешествия": "✈️ Путешествия
|
| 34 |
-
"развлечения": "🎬 Развлечения
|
| 35 |
-
"погода": "☀️ Погода
|
| 36 |
-
"происшествия": "🚨 Происшествия
|
| 37 |
}
|
| 38 |
|
| 39 |
# История запросов
|
|
|
|
| 4 |
import pandas as pd
|
| 5 |
from datetime import datetime
|
| 6 |
|
| 7 |
+
# Загружаем модель для тематической классификации
|
| 8 |
+
# Используем zero-shot классификатор, который не требует предобучения на конкретных темах
|
|
|
|
|
|
|
|
|
|
| 9 |
classifier = pipeline("zero-shot-classification",
|
| 10 |
model="facebook/bart-large-mnli",
|
| 11 |
+
device=-1) # device=-1 означает CPU
|
| 12 |
|
| 13 |
+
# Предопределённые темы для классификации (можно менять и добавлять)
|
| 14 |
PREDEFINED_TOPICS = [
|
| 15 |
"спорт", "политика", "наука", "технологии",
|
| 16 |
"здоровье", "образование", "культура", "экономика",
|
| 17 |
"путешествия", "развлечения", "погода", "происшествия"
|
| 18 |
]
|
| 19 |
|
| 20 |
+
# Словарь для расшифровки тем на русский с эмодзи
|
| 21 |
TOPIC_DESCRIPTIONS = {
|
| 22 |
+
"спорт": "🏀 Спорт",
|
| 23 |
+
"политика": "🏛️ Политика",
|
| 24 |
+
"наука": "🔬 Наука",
|
| 25 |
+
"технологии": "💻 Технологии",
|
| 26 |
+
"здоровье": "🏥 Здоровье",
|
| 27 |
+
"образование": "📚 Образование",
|
| 28 |
+
"культура": "🎭 Культура",
|
| 29 |
+
"экономика": "💰 Экономика",
|
| 30 |
+
"путешествия": "✈️ Путешествия",
|
| 31 |
+
"развлечения": "🎬 Развлечения",
|
| 32 |
+
"погода": "☀️ Погода",
|
| 33 |
+
"происшествия": "🚨 Происшествия"
|
| 34 |
}
|
| 35 |
|
| 36 |
# История запросов
|