IRM_Arc / README.md
ayarnte's picture
Upload folder using huggingface_hub
4d6b823 verified
metadata
library_name: transformers
tags:
  - regression
  - creativity
  - iclr
license: mit
pipeline_tag: text-classification

IRM High Ver

DeBERTa-v3-large をベースにした Idea Reward Model(不確実性回帰 + Isotonic 校正)。 入力: タイトル + アブストラクト → 回帰スコア(μ)と 0–1 の報酬にマッピング。