LoRA fine-tune on RobotSmith task03 after fixing dataset

aea53cd verified 19 days ago

572 Bytes

license: apache-2.0
base_model: Qwen/Qwen3-VL-4B-Instruct
tags:
  - reward_model
  - rbm
  - preference_comparisons
library_name: transformers

amburger66/robometer-4b-lora-robotsmith-task03

Base Model: Qwen/Qwen3-VL-4B-Instruct
Model Type: qwen3_vl

Model Details

If you use this model, please cite: