THU-KEG
/

WildReward-8B

Text Classification

text-embeddings-inference

Model card Files Files and versions

Wesleythu commited on Feb 7

Commit

a2301d9

·

verified ·

1 Parent(s): 6563ff4

Update README.md

Files changed (1) hide show

README.md +1 -1

README.md CHANGED Viewed

@@ -31,7 +31,7 @@ WildReward is trained using **ordinal regression** (CORAL-like approach) on the
 - **Source:** WildChat - large-scale human-LLM interactions
 - **Labeling:** 5-point ordinal scale based on user satisfaction signals
 - **Filtering:** Two-stage refinement including implicit feedback mining and refusal validation
-- **License:** [Specify your dataset license]
 ## Usage

 - **Source:** WildChat - large-scale human-LLM interactions
 - **Labeling:** 5-point ordinal scale based on user satisfaction signals
 - **Filtering:** Two-stage refinement including implicit feedback mining and refusal validation
+- **License:** MIT
 ## Usage