AI & ML interests
None yet
Organizations
None yet
ketchup123/DPO_llama_3_8B_mix_f
Updated
ketchup123/DPO_smollm_2_mix_e
ketchup123/DPO_llama_3_8B_mix_e
ketchup123/DPO_smollm_2_mix_c
Updated
ketchup123/DPO_smollm_2_mix_d
Updated
ketchup123/DPO_llama_3_8B_mix_d
Updated
ketchup123/DPO_llama_3_8B_mix_c
Updated
ketchup123/DPO_llama_3_8B_codepreferences_filtered
Updated
ketchup123/DPO_smollm_2_mix_b
Updated
ketchup123/DPO_smollm_2_mix_b_booster
Updated
ketchup123/DPO_llama_3_8B_mix_b
Updated
ketchup123/DPO_llama_3_8B_mix_b_booster
ketchup123/DPO_llama_3_8B_mix_a_booster
Updated
ketchup123/DPO_smollm_2_mix_a_booster
Updated
ketchup123/DPO_llama_3_8B_mix_a
ketchup123/DPO_smollm_2_mix_a
ketchup123/DPO_smollm_2_codepreferences
Updated
ketchup123/DPO_smollm_2_tulu
Updated
ketchup123/DPO_llama_3_8B_codepreferences
Updated
ketchup123/DPO_llama_3_8B_tulu
ketchup123/DPO_smollm_2_ultrafeedback
Updated
ketchup123/DPO_smollm_2_orpo
ketchup123/DPO_smollm_2_helpsteer
ketchup123/DPO_llama_3_8B_helpsteer
Updated
ketchup123/DPO_llama_3_8B_orpo
ketchup123/DPO_llama_3_8B_ultrafeedback
ketchup123/grpo_lighteval_verl
2B • Updated ketchup123/grpo_verl_numinamath
2B • Updated 0.6B • Updated 2B • Updated