marry1908 commited on
Commit
a123d2f
·
verified ·
1 Parent(s): 7ba1d61

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +17 -20
app.py CHANGED
@@ -4,36 +4,33 @@ import time
4
  import pandas as pd
5
  from datetime import datetime
6
 
7
- # Загружаем модель для тематической классификации (русский язык)
8
- model_name = "UrukHan/t5-russian-spell" # Или другую модель для topic classification
9
- # Альтернатива: "cointegrated/LaBSE-en-ru" или ищем модель специально для topic classification
10
-
11
- # Пока возьмём мультиязычную модель для демонстрации
12
  classifier = pipeline("zero-shot-classification",
13
  model="facebook/bart-large-mnli",
14
- device=-1) # CPU
15
 
16
- # Предопределённые темы для классификации
17
  PREDEFINED_TOPICS = [
18
  "спорт", "политика", "наука", "технологии",
19
  "здоровье", "образование", "культура", "экономика",
20
  "путешествия", "развлечения", "погода", "происшествия"
21
  ]
22
 
23
- # Словарь для расшифровки тем на русский
24
  TOPIC_DESCRIPTIONS = {
25
- "спорт": "🏀 Спорт - спортивные события, соревнования, команды",
26
- "политика": "🏛️ Политика - политические новости, выборы, законы",
27
- "наука": "🔬 Наука - научные открытия, исследования, технологии",
28
- "технологии": "💻 Технологии - IT, гаджеты, программы, интернет",
29
- "здоровье": "🏥 Здоровье - медицина, болезни, лечение, здоровый образ жизни",
30
- "образование": "📚 Образование - школы, вузы, обучение, экзамены",
31
- "культура": "🎭 Культура - искусство, музыка, кино, литература",
32
- "экономика": "💰 Экономика - финансы, бизнес, рынки, кризисы",
33
- "путешествия": "✈️ Путешествия - туризм, страны, достопримечательности",
34
- "развлечения": "🎬 Развлечения - фильмы, сериалы, игры, шоу",
35
- "погода": "☀️ Погода - климат, температура, природные явления",
36
- "происшествия": "🚨 Происшествия - аварии, катастрофы, криминал"
37
  }
38
 
39
  # История запросов
 
4
  import pandas as pd
5
  from datetime import datetime
6
 
7
+ # Загружаем модель для тематической классификации
8
+ # Используем zero-shot классификатор, который не требует предобучения на конкретных темах
 
 
 
9
  classifier = pipeline("zero-shot-classification",
10
  model="facebook/bart-large-mnli",
11
+ device=-1) # device=-1 означает CPU
12
 
13
+ # Предопределённые темы для классификации (можно менять и добавлять)
14
  PREDEFINED_TOPICS = [
15
  "спорт", "политика", "наука", "технологии",
16
  "здоровье", "образование", "культура", "экономика",
17
  "путешествия", "развлечения", "погода", "происшествия"
18
  ]
19
 
20
+ # Словарь для расшифровки тем на русский с эмодзи
21
  TOPIC_DESCRIPTIONS = {
22
+ "спорт": "🏀 Спорт",
23
+ "политика": "🏛️ Политика",
24
+ "наука": "🔬 Наука",
25
+ "технологии": "💻 Технологии",
26
+ "здоровье": "🏥 Здоровье",
27
+ "образование": "📚 Образование",
28
+ "культура": "🎭 Культура",
29
+ "экономика": "💰 Экономика",
30
+ "путешествия": "✈️ Путешествия",
31
+ "развлечения": "🎬 Развлечения",
32
+ "погода": "☀️ Погода",
33
+ "происшествия": "🚨 Происшествия"
34
  }
35
 
36
  # История запросов