finrubert / README.md
apkonsta's picture
Update README.md
1b4c71d verified
|
raw
history blame
1.5 kB
metadata
language:
  - ru
license: apache-2.0
base_model: cointegrated/rubert-tiny2
tags:
  - finance
  - sentiment-analysis
  - russian
datasets:
  - apkonsta/FinancialPhraseBank-v1.0-ru
metrics:
  - accuracy
  - f1

FinRuBERT

Fine-tuned модель для анализа тональности финансовых текстов на русском языке.

Описание

Модель была дообучена на датасете FinancialPhraseBank (русская версия) и предсказывает сентимент:

  • Негативный (negative)
  • Нейтральный (neutral)
  • Позитивный (positive)

Данные обучения

Использовалась версия датасета с согласием аннотаторов ≥50% (4,840 примеров):

Использование

from transformers import AutoModelForSequenceClassification, AutoTokenizer, pipeline

model_name = "apkonsta/finrubert"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSequenceClassification.from_pretrained(model_name)

classifier = pipeline("text-classification", model=model, tokenizer=tokenizer)
result = classifier("Прибыль компании сократилась на 15% в этом квартале")

print(result)  # [{'label': 'negative', 'score': 0.88}]