THU-KEG
/

WildReward-4B

Text Classification

text-embeddings-inference

Model card Files Files and versions

Wesleythu commited on 6 days ago

Commit

ec67a1c

·

verified ·

1 Parent(s): 261701e

Update README.md

Files changed (1) hide show

README.md +2 -2

README.md CHANGED Viewed

@@ -31,7 +31,7 @@ WildReward is trained using **ordinal regression** (CORAL-like approach) on the
 - **Source:** WildChat - large-scale human-LLM interactions
 - **Labeling:** 5-point ordinal scale based on user satisfaction signals
 - **Filtering:** Two-stage refinement including implicit feedback mining and refusal validation
-- **License:** [Specify your dataset license]
 ## Usage
@@ -41,7 +41,7 @@ WildReward is trained using **ordinal regression** (CORAL-like approach) on the
 import torch
 from transformers import AutoTokenizer, AutoModelForSequenceClassification
-model_name = "yourusername/WildReward-4B"
 tokenizer = AutoTokenizer.from_pretrained(model_name)
 model = AutoModelForSequenceClassification.from_pretrained(model_name)

 - **Source:** WildChat - large-scale human-LLM interactions
 - **Labeling:** 5-point ordinal scale based on user satisfaction signals
 - **Filtering:** Two-stage refinement including implicit feedback mining and refusal validation
+- **License:** MIT
 ## Usage
 import torch
 from transformers import AutoTokenizer, AutoModelForSequenceClassification
+model_name = "THU-KEG/WildReward-4B"
 tokenizer = AutoTokenizer.from_pretrained(model_name)
 model = AutoModelForSequenceClassification.from_pretrained(model_name)