metadata
language:
- ru
license: apache-2.0
base_model: cointegrated/rubert-tiny2
tags:
- finance
- sentiment-analysis
- russian
datasets:
- apkonsta/FinancialPhraseBank-v1.0-ru
metrics:
- accuracy
- f1
FinRuBERT
Fine-tuned модель для анализа тональности финансовых текстов на русском языке.
Описание
Модель была дообучена на датасете FinancialPhraseBank (русская версия) и предсказывает сентимент:
- Негативный (
negative) - Нейтральный (
neutral) - Позитивный (
positive)
Данные обучения
Использовалась версия датасета с согласием аннотаторов ≥50% (4,840 примеров):
- Sentences_50Agree.csv из FinancialPhraseBank-v1.0-ru
Использование
from transformers import AutoModelForSequenceClassification, AutoTokenizer, pipeline
model_name = "apkonsta/finrubert"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSequenceClassification.from_pretrained(model_name)
classifier = pipeline("text-classification", model=model, tokenizer=tokenizer)
result = classifier("Прибыль компании сократилась на 15% в этом квартале")
print(result) # [{'label': 'negative', 'score': 0.88}]