ChGK_NER / README.md
borisMI's picture
Update README.md
1adc2bd verified
---
license: mit
language:
- ru
library_name: transformers
pipeline_tag: token-classification
tags:
- ner
- ru
- chgk
base_model:
- ai-forever/ruBert-large
---
# NER-модель для извлечения сущностей из текстов "Что? Где? Когда?"
Это модель для **распознавания именованных сущностей (NER)**, дообученная на базе `ai-forever/ruBert-large`. Модель была создана в рамках пет-проекта для анализа текстов вопросов игры "Что? Где? Когда?".
## 🚀 Интерактивное демо
Вы можете протестировать эту модель в действии в интерактивном веб-приложении на **Hugging Face Spaces**:
**[➡️ Перейти к демо ⬅️](https://huggingface.co/spaces/borisMI/ChGK_NER_demo)**
## 🏷️ Извлекаемые сущности
Модель обучена распознавать 5 типов сущностей:
* `AUTHOR`: Авторы (писатели, художники, композиторы и т.д.)
* `CHARACTER`: Персонажи (литературные, вымышленные)
* `LOCATION`: Локации (города, страны, географические объекты)
* `PERSON`: Персоналии (реальные исторические личности, ученые, политики)
* `WORK_OF_ART`: Произведения искусства (книги, картины, фильмы и т.д.)
## 📊 Качество модели
Модель была оценена на тестовом наборе данных. Ниже представлены итоговые метрики F1-score для каждого класса.
| Категория | F1-score |
|---------------|----------|
| **AUTHOR** | **0.826**|
| **LOCATION** | **0.825**|
| **WORK_OF_ART**| **0.810**|
| **CHARACTER** | **0.672**|
| **PERSON** | **0.625**|
Модель демонстрирует высокую надежность для классов `AUTHOR`, `LOCATION` и `WORK_OF_ART`. Классы `PERSON` и `CHARACTER` оказались более сложными из-за семантической близости, что отражено в их метриках.