ZHANG Jipeng's picture

ZHANG Jipeng

2003pro

·

AI & ML interests

NLP

Recent Activity

upvoted a collection 3 days ago

Nemotron-Terminal

upvoted a paper 3 days ago

On Data Engineering for Scaling LLM Terminal Capabilities

upvoted a paper about 2 months ago

GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization

View all activity

Organizations

None yet

Papers 1

arxiv:2312.11370

models 0

None public yet

datasets 0

None public yet