8y
/

HP

Model card Files Files and versions

xet

Community

8y commited on Jul 28, 2025

Commit

7fcd3d8

verified ·

1 Parent(s): 4820f0d

Update README.md

Browse files

Files changed (1) hide show

README.md +12 -9

README.md CHANGED Viewed

@@ -1,6 +1,6 @@
 # Model Card for HP (High-Preference) Model
-This model is a specialized human preference scoring function that evaluates image quality based purely on visual aesthetics and human preferences, without relying on text-image alignment. See our paper [Enhancing Reward Models for High-quality Image Generation: Beyond Text-Image Alignment]() for more details.
 ## Model Details
@@ -19,7 +19,7 @@ The HP (High-Preference) model represents a paradigm shift in image quality eval
 ### Model Sources
 * **Repository:** [https://github.com/BarretBa/ICTHP](https://github.com/BarretBa/ICTHP)
-* **Paper:** [Enhancing Reward Models for High-quality Image Generation: Beyond Text-Image Alignment](https://arxiv.org/abs/xxxx.xxxxx)
 * **Base Model:** CLIP-ViT-H-14 (Image Encoder + MLP Head)
 * **Training Dataset:** [Pick-High datase](https://huggingface.co/datasets/8y/Pick-High-Dataset) and Pick-a-pic dataset (360,000 preference triplets)
@@ -88,15 +88,18 @@ print(f"HP Scores: {scores}")
 ### Training Data
 This model was trained on 36000 preference triplets from [Pick-High datase](https://huggingface.co/datasets/8y/Pick-High-Dataset) and Pick-a-pic dataset.
-<!--
 ## Citation
 ```bibtex
-@article{ba2024enhancing,
-  title={Enhancing Reward Models for High-quality Image Generation: Beyond Text-Image Alignment},
-  author={Ba, Ying and Zhang, Tianyu and Bai, Yalong and Mo, Wenyi and Liang, Tao and Su, Bing and Wen, Ji-Rong},
-  journal={arXiv preprint arXiv:xxxx.xxxxx},
-  year={2024}
 }
-``` -->

 # Model Card for HP (High-Preference) Model
+This model is a specialized human preference scoring function that evaluates image quality based purely on visual aesthetics and human preferences, without relying on text-image alignment. See our paper [Enhancing Reward Models for High-quality Image Generation: Beyond Text-Image Alignment](https://arxiv.org/abs/2507.19002) for more details.
 ## Model Details
 ### Model Sources
 * **Repository:** [https://github.com/BarretBa/ICTHP](https://github.com/BarretBa/ICTHP)
+* **Paper:** [Enhancing Reward Models for High-quality Image Generation: Beyond Text-Image Alignment](https://arxiv.org/abs/2507.19002)
 * **Base Model:** CLIP-ViT-H-14 (Image Encoder + MLP Head)
 * **Training Dataset:** [Pick-High datase](https://huggingface.co/datasets/8y/Pick-High-Dataset) and Pick-a-pic dataset (360,000 preference triplets)
 ### Training Data
 This model was trained on 36000 preference triplets from [Pick-High datase](https://huggingface.co/datasets/8y/Pick-High-Dataset) and Pick-a-pic dataset.
 ## Citation
 ```bibtex
+@misc{ba2025enhancingrewardmodelshighquality,
+      title={Enhancing Reward Models for High-quality Image Generation: Beyond Text-Image Alignment},
+      author={Ying Ba and Tianyu Zhang and Yalong Bai and Wenyi Mo and Tao Liang and Bing Su and Ji-Rong Wen},
+      year={2025},
+      eprint={2507.19002},
+      archivePrefix={arXiv},
+      primaryClass={cs.CV},
+      url={https://arxiv.org/abs/2507.19002},
 }
+```