YunzheQ's picture

10

YunzheQ

yunzhe0306

AI & ML interests

None yet

Recent Activity

upvoted a paper 1 day ago

RubricEM: Meta-RL with Rubric-guided Policy Decomposition beyond Verifiable Rewards

upvoted a paper 14 days ago

Heterogeneous Scientific Foundation Model Collaboration

upvoted a paper 16 days ago

Recursive Multi-Agent Systems

View all activity

Organizations

None yet

upvoted a paper 1 day ago

RubricEM: Meta-RL with Rubric-guided Policy Decomposition beyond Verifiable Rewards

Paper • 2605.10899 • Published 4 days ago • 70

upvoted a paper 14 days ago

Heterogeneous Scientific Foundation Model Collaboration

Paper • 2604.27351 • Published 15 days ago • 212

upvoted a paper 16 days ago

Recursive Multi-Agent Systems

Paper • 2604.25917 • Published 17 days ago • 265

upvoted a collection 21 days ago

DeepSeek-V4

4 items • Updated 21 days ago • 639

upvoted a paper 29 days ago

The Blind Spot of Agent Safety: How Benign User Instructions Expose Critical Vulnerabilities in Computer-Use Agents

Paper • 2604.10577 • Published Apr 12 • 25

upvoted a paper 2 months ago

dLLM: Simple Diffusion Language Modeling

Paper • 2602.22661 • Published Feb 26 • 153

upvoted a paper 3 months ago

Weak-Driven Learning: How Weak Agents make Strong Agents Stronger

Paper • 2602.08222 • Published Feb 9 • 290

upvoted 2 papers 4 months ago

Agentic Reasoning for Large Language Models

Paper • 2601.12538 • Published Jan 18 • 204

Your Group-Relative Advantage Is Biased

Paper • 2601.08521 • Published Jan 13 • 158

upvoted a paper 11 months ago

Saffron-1: Towards an Inference Scaling Paradigm for LLM Safety Assurance

Paper • 2506.06444 • Published Jun 6, 2025 • 73