| | --- |
| | language: |
| | - ru |
| | license: apache-2.0 |
| | base_model: cointegrated/rubert-tiny2 |
| | tags: |
| | - finance |
| | - sentiment-analysis |
| | - russian |
| | datasets: |
| | - apkonsta/FinancialPhraseBank-v1.0-ru |
| | metrics: |
| | - accuracy |
| | - f1 |
| | --- |
| | |
| | # FinRuBERT |
| |
|
| | Fine-tuned модель для анализа тональности финансовых текстов на русском языке. |
| |
|
| | ## Описание |
| | Модель была дообучена на датасете FinancialPhraseBank (русская версия) и предсказывает сентимент: |
| | - **Негативный** (`negative`) |
| | - **Нейтральный** (`neutral`) |
| | - **Позитивный** (`positive`) |
| |
|
| | ## Данные обучения |
| | Использовалась версия датасета с согласием аннотаторов ≥50% (4,840 примеров): |
| | - Sentences_50Agree.csv из [FinancialPhraseBank-v1.0-ru](https://huggingface.co/datasets/apkonsta/FinancialPhraseBank-v1.0-ru) |
| | |
| | ## Использование |
| | |
| | ```python |
| | from transformers import AutoModelForSequenceClassification, AutoTokenizer, pipeline |
| | |
| | model_name = "apkonsta/finrubert" |
| | tokenizer = AutoTokenizer.from_pretrained(model_name) |
| | model = AutoModelForSequenceClassification.from_pretrained(model_name) |
| |
|
| | classifier = pipeline("text-classification", model=model, tokenizer=tokenizer) |
| | result = classifier("Прибыль компании сократилась на 15% в этом квартале") |
| |
|
| | print(result) # [{'label': 'negative', 'score': 0.88}] |