| library_name: transformers | |
| tags: | |
| - regression | |
| - creativity | |
| - iclr | |
| license: mit | |
| pipeline_tag: text-classification | |
| # IRM High Ver | |
| DeBERTa-v3-large をベースにした Idea Reward Model(不確実性回帰 + Isotonic 校正)。 | |
| 入力: タイトル + アブストラクト → 回帰スコア(μ)と 0–1 の報酬にマッピング。 | |
| library_name: transformers | |
| tags: | |
| - regression | |
| - creativity | |
| - iclr | |
| license: mit | |
| pipeline_tag: text-classification | |
| # IRM High Ver | |
| DeBERTa-v3-large をベースにした Idea Reward Model(不確実性回帰 + Isotonic 校正)。 | |
| 入力: タイトル + アブストラクト → 回帰スコア(μ)と 0–1 の報酬にマッピング。 | |