sagteam/cedr_v1
Viewer • Updated • 18.8k • 448 • 6
Multi-label классификатор эмоций для русскоязычных текстов.
Обучен на датасете CEDR с взвешенным BCE loss для корректной работы с дисбалансом классов.
Базовая модель: cointegrated/rubert-tiny2
F1-micro: 0.7247 | F1-macro: 0.6823
from transformers import pipeline
classifier = pipeline(
"text-classification",
model="ilyali034/rubert-emotion-ru",
return_all_scores=True,
)
results = classifier("Я очень рад, но немного боюсь")[0]
for r in sorted(results, key=lambda x: -x["score"]):
if r["score"] > 0.5:
print(r["label"], round(r["score"], 3))
| Метрика | Значение |
|---|---|
| F1 micro | 0.7247 |
| F1 macro | 0.6823 |
| F1 weighted | 0.7389 |
| Precision micro | 0.6193 |
| Recall micro | 0.8733 |
| Класс | F1 |
|---|---|
| joy | 0.8391 |
| sadness | 0.8057 |
| surprise | 0.6711 |
| fear | 0.6488 |
| anger | 0.4468 |
joy · sadness · surprise · fear · anger
Base model
cointegrated/rubert-tiny2