teetone
/

RoboReward-4B

Add metadata and project links

by nielsr HF Staff - opened Jan 9

←

Files changed (1) hide show

README.md CHANGED Viewed

@@ -1,19 +1,20 @@
 ---
-license: cc-by-4.0
 datasets:
 - teetone/RoboReward
 language:
 - en
-base_model:
-- Qwen/Qwen3-VL-4B-Instruct
 ---
 # RoboReward 4B
-**Paper:** [https://arxiv.org/abs/2601.00675](https://arxiv.org/abs/2601.00675)
-RoboReward provides **general-purpose vision-language reward model for robotics**, trained on the [RoboReward dataset](https://huggingface.co/datasets/teetone/RoboReward) with **Qwen-3 VL** to predict **discrete end-of-episode progress rewards** from real-robot rollout videos.
 ## Usage

 ---
+base_model:
+- Qwen/Qwen3-VL-4B-Instruct
 datasets:
 - teetone/RoboReward
 language:
 - en
+license: cc-by-4.0
+library_name: transformers
+pipeline_tag: robotics
 ---
 # RoboReward 4B
+[**Project Website**](https://crfm.stanford.edu/helm/robo-reward-bench) | **Paper:** [https://arxiv.org/abs/2601.00675](https://arxiv.org/abs/2601.00675)
+RoboReward provides **general-purpose vision-language reward models for robotics**, trained on the [RoboReward dataset](https://huggingface.co/datasets/teetone/RoboReward) with **Qwen-3 VL** to predict **discrete end-of-episode progress rewards** from real-robot rollout videos.
 ## Usage