finrubert / README.md
apkonsta's picture
Update README.md
1b4c71d verified
|
raw
history blame
1.5 kB
---
language:
- ru
license: apache-2.0
base_model: cointegrated/rubert-tiny2
tags:
- finance
- sentiment-analysis
- russian
datasets:
- apkonsta/FinancialPhraseBank-v1.0-ru
metrics:
- accuracy
- f1
---
# FinRuBERT
Fine-tuned модель для анализа тональности финансовых текстов на русском языке.
## Описание
Модель была дообучена на датасете FinancialPhraseBank (русская версия) и предсказывает сентимент:
- **Негативный** (`negative`)
- **Нейтральный** (`neutral`)
- **Позитивный** (`positive`)
## Данные обучения
Использовалась версия датасета с согласием аннотаторов ≥50% (4,840 примеров):
- Sentences_50Agree.csv из [FinancialPhraseBank-v1.0-ru](https://huggingface.co/datasets/apkonsta/FinancialPhraseBank-v1.0-ru)
## Использование
```python
from transformers import AutoModelForSequenceClassification, AutoTokenizer, pipeline
model_name = "apkonsta/finrubert"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSequenceClassification.from_pretrained(model_name)
classifier = pipeline("text-classification", model=model, tokenizer=tokenizer)
result = classifier("Прибыль компании сократилась на 15% в этом квартале")
print(result) # [{'label': 'negative', 'score': 0.88}]