File size: 359 Bytes
4d6b823
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
---
library_name: transformers
tags:
  - regression
  - creativity
  - iclr
license: mit
pipeline_tag: text-classification
---

# IRM High Ver

DeBERTa-v3-large をベースにした Idea Reward Model(不確実性回帰 + Isotonic 校正)。
入力: タイトル + アブストラクト → 回帰スコア(μ)と 0–1 の報酬にマッピング。