apkonsta
/

finrubert

sentiment-analysis

Model card Files Files and versions

finrubert / README.md

apkonsta's picture

Update README.md

c809446 verified 8 months ago

|

history blame contribute delete

1.99 kB

	---
	language:
	- ru
	license: apache-2.0
	base_model: cointegrated/rubert-tiny2
	tags:
	- finance
	- sentiment-analysis
	- russian
	datasets:
	- apkonsta/FinancialPhraseBank-v1.0-ru
	metrics:
	- accuracy
	- f1
	---

	# FinRuBERT

	Fine-tuned модель для анализа тональности финансовых текстов на русском языке.

	## Описание
	Модель была дообучена на датасете FinancialPhraseBank (русская версия) и предсказывает сентимент:
	- Негативный (`negative`)
	- Нейтральный (`neutral`)
	- Позитивный (`positive`)

	## Данные обучения
	Использовалась версия датасета с согласием аннотаторов ≥50% (4,840 примеров):
	- Sentences_50Agree.csv из [FinancialPhraseBank-v1.0-ru](https://huggingface.co/datasets/apkonsta/FinancialPhraseBank-v1.0-ru)

	## Использование

	```python
	from transformers import AutoModelForSequenceClassification, AutoTokenizer, pipeline

	model_name = "apkonsta/finrubert"
	tokenizer = AutoTokenizer.from_pretrained(model_name)
	model = AutoModelForSequenceClassification.from_pretrained(model_name)

	classifier = pipeline("text-classification", model=model, tokenizer=tokenizer)
	result = classifier("""Чистая прибыль "ЛУКОЙЛа" (MOEX: LKOH) в 2023 году по МСФО составила 1,155 трлн руб., сообщила компания.В первом полугодии чистая прибыль нефтекомпании составила 564,1 млрд рублей. Таким образом, чистая прибыль по итогам второго полугодия - 590,6 млрд рублей, что выше консенсус-прогноза "Интерфакса" (589 млрд рублей).
	""")

	print(result) # [{'label': 'positive', 'score': 0.7818681001663208}]