Models
Datasets
Spaces
Buckets new
Docs
Enterprise
Pricing
- Website
- Community
- Solutions
Log In
Sign Up

Oxford Human Information Processing Lab

university

https://humaninformationprocessing.com

AI & ML interests

None defined yet.

Oxford-HIPlab 's collections 1

Reward Models Inherit Value Biases from Pretraining ICLR2026

Reward models and logprobs for the paper Christian et al., "Reward Models Inherit Value Biases from Pretraining" (ICLR 2026)

Oxford-HIPlab/BT_LoRA_skywork80k_on_gemma-2-2b-it_seed1

Updated Sep 12, 2025
Oxford-HIPlab/BT_LoRA_skywork80k_on_gemma-2-2b-it_seed1-every_1

Updated Sep 20, 2025
Oxford-HIPlab/BT_LoRA_skywork80k_on_gemma-2-2b-it_seed1-every_10

Updated Sep 20, 2025
Oxford-HIPlab/BT_LoRA_skywork80k_on_Llama_3.2_3B_Instruct_seed1

Updated Sep 12, 2025

Reward Models Inherit Value Biases from Pretraining ICLR2026

Reward models and logprobs for the paper Christian et al., "Reward Models Inherit Value Biases from Pretraining" (ICLR 2026)

Oxford-HIPlab/BT_LoRA_skywork80k_on_gemma-2-2b-it_seed1

Updated Sep 12, 2025
Oxford-HIPlab/BT_LoRA_skywork80k_on_gemma-2-2b-it_seed1-every_1

Updated Sep 20, 2025
Oxford-HIPlab/BT_LoRA_skywork80k_on_gemma-2-2b-it_seed1-every_10

Updated Sep 20, 2025
Oxford-HIPlab/BT_LoRA_skywork80k_on_Llama_3.2_3B_Instruct_seed1

Updated Sep 12, 2025

Company

TOS Privacy About Careers

Website

Models Datasets Spaces Pricing Docs