finrubert / README.md
apkonsta's picture
Update README.md
c809446 verified
---
language:
- ru
license: apache-2.0
base_model: cointegrated/rubert-tiny2
tags:
- finance
- sentiment-analysis
- russian
datasets:
- apkonsta/FinancialPhraseBank-v1.0-ru
metrics:
- accuracy
- f1
---
# FinRuBERT
Fine-tuned модель для анализа тональности финансовых текстов на русском языке.
## Описание
Модель была дообучена на датасете FinancialPhraseBank (русская версия) и предсказывает сентимент:
- **Негативный** (`negative`)
- **Нейтральный** (`neutral`)
- **Позитивный** (`positive`)
## Данные обучения
Использовалась версия датасета с согласием аннотаторов ≥50% (4,840 примеров):
- Sentences_50Agree.csv из [FinancialPhraseBank-v1.0-ru](https://huggingface.co/datasets/apkonsta/FinancialPhraseBank-v1.0-ru)
## Использование
```python
from transformers import AutoModelForSequenceClassification, AutoTokenizer, pipeline
model_name = "apkonsta/finrubert"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSequenceClassification.from_pretrained(model_name)
classifier = pipeline("text-classification", model=model, tokenizer=tokenizer)
result = classifier("""Чистая прибыль "ЛУКОЙЛа" (MOEX: LKOH) в 2023 году по МСФО составила 1,155 трлн руб., сообщила компания.В первом полугодии чистая прибыль нефтекомпании составила 564,1 млрд рублей. Таким образом, чистая прибыль по итогам второго полугодия - 590,6 млрд рублей, что выше консенсус-прогноза "Интерфакса" (589 млрд рублей).
""")
print(result) # [{'label': 'positive', 'score': 0.7818681001663208}]