Qihang Peng's picture

4 4

Qihang Peng

pqh22

·

pqh22

AI & ML interests

cv

Recent Activity

upvoted a paper about 15 hours ago

InterleaveThinker: Reinforcing Agentic Interleaved Generation

updated a dataset 3 months ago

liked a dataset 3 months ago

View all activity

Organizations

None yet

upvoted a paper about 15 hours ago

InterleaveThinker: Reinforcing Agentic Interleaved Generation

Paper • 2606.13679 • Published 1 day ago • 71

upvoted 2 papers about 1 year ago

Does Reinforcement Learning Really Incentivize Reasoning Capacity in LLMs Beyond the Base Model?

Paper • 2504.13837 • Published Apr 18, 2025 • 141

4D LangSplat: 4D Language Gaussian Splatting via Multimodal Large Language Models

Paper • 2503.10437 • Published Mar 13, 2025 • 34

upvoted an article over 1 year ago

Article

Illustrating Reinforcement Learning from Human Feedback (RLHF)

+2

natolambert, LouisCastricato, lvwerra, Dahoas

•

Dec 9, 2022

• 416