File size: 1,989 Bytes
f1b67a4
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1b4c71d
f1b67a4
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
c809446
 
f1b67a4
c809446
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
---
language:
- ru
license: apache-2.0
base_model: cointegrated/rubert-tiny2
tags:
- finance
- sentiment-analysis
- russian
datasets:
- apkonsta/FinancialPhraseBank-v1.0-ru
metrics:
- accuracy
- f1
---

# FinRuBERT

Fine-tuned модель для анализа тональности финансовых текстов на русском языке.

## Описание
Модель была дообучена на датасете FinancialPhraseBank (русская версия) и предсказывает сентимент:
- **Негативный** (`negative`)
- **Нейтральный** (`neutral`)
- **Позитивный** (`positive`)

## Данные обучения
Использовалась версия датасета с согласием аннотаторов ≥50% (4,840 примеров):
- Sentences_50Agree.csv из [FinancialPhraseBank-v1.0-ru](https://huggingface.co/datasets/apkonsta/FinancialPhraseBank-v1.0-ru)

## Использование

```python
from transformers import AutoModelForSequenceClassification, AutoTokenizer, pipeline

model_name = "apkonsta/finrubert"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSequenceClassification.from_pretrained(model_name)

classifier = pipeline("text-classification", model=model, tokenizer=tokenizer)
result = classifier("""Чистая прибыль "ЛУКОЙЛа" (MOEX: LKOH) в 2023 году по МСФО составила 1,155 трлн руб., сообщила компания.В первом полугодии чистая прибыль нефтекомпании составила 564,1 млрд рублей. Таким образом, чистая прибыль по итогам второго полугодия - 590,6 млрд рублей, что выше консенсус-прогноза "Интерфакса" (589 млрд рублей).
                    """)

print(result)  # [{'label': 'positive', 'score': 0.7818681001663208}]