finrubert / README.md

apkonsta

Update README.md

1b4c71d verified 9 months ago

1.5 kB

language:
  - ru
license: apache-2.0
base_model: cointegrated/rubert-tiny2
tags:
  - finance
  - sentiment-analysis
  - russian
datasets:
  - apkonsta/FinancialPhraseBank-v1.0-ru
metrics:
  - accuracy
  - f1

FinRuBERT

Fine-tuned модель для анализа тональности финансовых текстов на русском языке.

Описание

Модель была дообучена на датасете FinancialPhraseBank (русская версия) и предсказывает сентимент:

Негативный (negative)
Нейтральный (neutral)
Позитивный (positive)

Данные обучения

Использовалась версия датасета с согласием аннотаторов ≥50% (4,840 примеров):

Sentences_50Agree.csv из FinancialPhraseBank-v1.0-ru

Использование

from transformers import AutoModelForSequenceClassification, AutoTokenizer, pipeline

model_name = "apkonsta/finrubert"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSequenceClassification.from_pretrained(model_name)

classifier = pipeline("text-classification", model=model, tokenizer=tokenizer)
result = classifier("Прибыль компании сократилась на 15% в этом квартале")

print(result)  # [{'label': 'negative', 'score': 0.88}]