Spaces:

Baidarkaa
/

Practice

Sleeping

App Files Files Community

Baidarkaa commited on Jan 21

Commit

597dda2

verified ·

1 Parent(s): cc6d0dd

Update app.py

Browse files

Files changed (1) hide show

app.py +7 -8

app.py CHANGED Viewed

@@ -6,13 +6,13 @@ from transformers import pipeline, AutoTokenizer, AutoModelForTokenClassificatio
 # ================== КОНФИГУРАЦИЯ ==================
 # Можно легко добавить новые модели
 MODELS = {
-    "Davlan/xlm-roberta-large-ner-hrl": "Многоязычная (50+ языков, 7 типов сущностей)",
-    "Babelscape/wikineural-multilingual-ner": "Многоязычная (википедия, 4 типа)",
-    "ai-forever/ruBert-base-ner": "Русская (4 типа сущностей)",
 }
 # Выбранная модель по умолчанию
-DEFAULT_MODEL = "Davlan/xlm-roberta-large-ner-hrl"
 # Цвета для разных типов сущностей (для красивого отображения)
 ENTITY_COLORS = {
@@ -29,7 +29,6 @@ ENTITY_COLORS = {
 MAX_CHARS = 2000  # ограничение длины текста
-# ================== ИНИЦИАЛИЗАЦИЯ ==================
 def load_model(model_name):
     """Загрузка модели и токенизатора"""
     try:
@@ -39,8 +38,8 @@ def load_model(model_name):
             "ner",
             model=model,
             tokenizer=tokenizer,
-            aggregation_strategy="simple",  # группируем токены
-            device=-1  # CPU (для Space)
         )
         return nlp_pipeline
     except Exception as e:
@@ -55,7 +54,7 @@ except Exception as e:
     pipe = None
     current_model_name = None
-# ================== ОСНОВНАЯ ФУНКЦИЯ ==================
 def extract_entities(text, model_choice):
     global pipe, current_model_name

 # ================== КОНФИГУРАЦИЯ ==================
 # Можно легко добавить новые модели
 MODELS = {
+    "Davlan/xlm-roberta-base-ner-hrl",
+    "Babelscape/wikineural-multilingual-ner",
+    "CAMeL-Lab/bert-base-arabic-camelbert-mix-ner",
 }
 # Выбранная модель по умолчанию
+DEFAULT_MODEL = "DDavlan/xlm-roberta-base-ner-hrl"
 # Цвета для разных типов сущностей (для красивого отображения)
 ENTITY_COLORS = {
 MAX_CHARS = 2000  # ограничение длины текста
 def load_model(model_name):
     """Загрузка модели и токенизатора"""
     try:
             "ner",
             model=model,
             tokenizer=tokenizer,
+            aggregation_strategy="simple",
+            device=-1
         )
         return nlp_pipeline
     except Exception as e:
     pipe = None
     current_model_name = None
 def extract_entities(text, model_choice):
     global pipe, current_model_name