Liu's picture

1

Liu

happyfighting

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 2 days ago

GD^2PO: Mitigating Multi-Reward Conflicts via Group-Dynamic reward-Decoupled Policy Optimization

updated a model 8 months ago

happyfighting/Qwen2.5-3B-Instruct-kklogic_grpo_baseline_53_gpg_sig_r_js2_kl_false

published a model 8 months ago

happyfighting/Qwen2.5-3B-Instruct-kklogic_grpo_baseline_53_gpg_sig_r_js2_kl_false

View all activity

Organizations

upvoted a paper 2 days ago

GD^2PO: Mitigating Multi-Reward Conflicts via Group-Dynamic reward-Decoupled Policy Optimization

Paper • 2606.16771 • Published 4 days ago • 10