PingchengDong's picture

2 5

PingchengDong

heisei

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 2 days ago

GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization

liked a model about 1 month ago

nvidia/DLER-R1-7B-Research

liked a model about 1 month ago

nvidia/DLER-Llama-Nemotron-8B-Merge-Research

View all activity

Organizations

None yet

upvoted a paper 2 days ago

GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization

Paper • 2601.05242 • Published 3 days ago • 126

liked 3 models about 1 month ago

nvidia/DLER-R1-7B-Research

8B • Updated Oct 25, 2025 • 1.13k • 15

nvidia/DLER-Llama-Nemotron-8B-Merge-Research

8B • Updated Oct 25, 2025 • 79 • 15

nvidia/DLER-R1-1.5B-Research

2B • Updated Oct 25, 2025 • 29.4k • 17

upvoted a collection 3 months ago

Reasoning Efficiency Research

Ultra-efficient reasoning model! SOTA Accuracy / CoT Length trade-offs • 3 items • Updated 18 days ago • 11

liked a model over 1 year ago

Palak/albert-base-v2_squad

Question Answering • Updated Dec 24, 2021 • 13 • 1

liked a Space almost 2 years ago

Depth Anything

Generate depth map from an image