d0rj/dialogsum-ru
Viewer • Updated • 14.5k • 259 • 5
Артефакты магистерской ВКР НИУ ИТМО «Семантический анализ русскоязычных диалогов для задачи распознавания намерений с улучшением на базе предобученных моделей».
Модель и сопутствующие материалы получены из ноутбука
notebooks/11_neural_multitask_intent_topic_dialogsum_ru.ipynb репозитория
russian-dialogue-intent-thesis.
DeepPavlov/rubert-base-cased-conversational (RuBERT
conversational, ~178M параметров).d0rj/dialogsum-ru) с weak rule-based
intent-разметкой и тематическими кластерами из эмбеддинговой
кластеризации (см. ноутбуки 07–10).val_intent_f1_macro, batch=16, max_len=128, lr=2e-5,
class_weight_mode='sqrt'. Multi-task с lambda_topic = 0.1 отстаёт
примерно на 0.019 по macro-F1.См. файлы из results/ после выгрузки.
arrangementcomplaintconfirmationfarewellgreetinginformational_requestopinion_or_preferenceotherproblem_reportpurchase_or_booking_requestrejectionservice_requestsuggestion_or_recommendationthankssingle_task_intent_model.pt — лучшая intent-модель (state_dict).multitask_intent_topic_model.pt — multi-task модель (intent + topic + coarse).intent_label_encoder.joblib, topic_label_encoder.joblib,
coarse_topic_label_encoder.joblib — sklearn LabelEncoder для каждой головы.multitask_config.json — гиперпараметры и метаданные запуска.results/*.csv — метрики, training history, predictions,
top-confusions, error examples, per-cluster metrics,
active learning кандидаты, label-noise кандидаты.figures/*.png — confusion matrices.import joblib
import torch
from huggingface_hub import hf_hub_download
repo_id = "ozonize/dialogsum-ru-intent-rubert"
ckpt_path = hf_hub_download(repo_id=repo_id, filename="single_task_intent_model.pt")
enc_path = hf_hub_download(repo_id=repo_id, filename="intent_label_encoder.joblib")
intent_encoder = joblib.load(enc_path)
state_dict = torch.load(ckpt_path, map_location="cpu")
# архитектуру модели см. в ячейке 5 ноутбука 11
Артефакты используются веб-приложением
dialogsum_intent_webapp.
10 и
..._active_learning_diverse_top100.csv).08;
fine-topic accuracy ≈ 0.21, coarse-topic ≈ 0.51.other размыт по определению и тянет macro-F1 вниз; в отчётах
отдельно публикуется intent_f1_macro_without_other.@mastersthesis{dialogsum_ru_intent_thesis,
title = {Семантический анализ русскоязычных диалогов для задачи распознавания намерений с улучшением на базе предобученных моделей},
author = {0z0nize},
school = {НИУ ИТМО, магистратура «Аналитика данных»},
year = {2026}
}
Base model
DeepPavlov/rubert-base-cased-conversational