Haoyu Wang

Harryis

2 17 5

AI & ML interests

None yet

Recent Activity

upvoted a paper 17 days ago

Qwen-AgentWorld: Language World Models for General Agents

upvoted a paper 19 days ago

S-Agent: Spatial Tool-Use Elicits Reasoning for Spatial Intelligence

upvoted a paper 24 days ago

Learning from the Self-future: On-policy Self-distillation for dLLMs

View all activity

Organizations

None yet

upvoted a paper 17 days ago

Qwen-AgentWorld: Language World Models for General Agents

Paper • 2606.24597 • Published 19 days ago • 146

upvoted a paper 19 days ago

S-Agent: Spatial Tool-Use Elicits Reasoning for Spatial Intelligence

Paper • 2606.20515 • Published 24 days ago • 40

upvoted a paper 24 days ago

Learning from the Self-future: On-policy Self-distillation for dLLMs

Paper • 2606.18195 • Published 26 days ago • 76

upvoted a paper 3 months ago

RAGEN-2: Reasoning Collapse in Agentic RL

Paper • 2604.06268 • Published Apr 7 • 69

upvoted 2 papers 5 months ago

VTC-R1: Vision-Text Compression for Efficient Long-Context Reasoning

Paper • 2601.22069 • Published Jan 29 • 7

Language-based Trial and Error Falls Behind in the Era of Experience

Paper • 2601.21754 • Published Jan 29 • 16

upvoted a paper 6 months ago

DeepResearchEval: An Automated Framework for Deep Research Task Construction and Agentic Evaluation

Paper • 2601.09688 • Published Jan 14 • 128

upvoted a paper 8 months ago

Diffusion Language Models are Super Data Learners

Paper • 2511.03276 • Published Nov 5, 2025 • 132

upvoted 2 papers 9 months ago

A-MemGuard: A Proactive Defense Framework for LLM-Based Agent Memory

Paper • 2510.02373 • Published Sep 29, 2025 • 10

GEM: A Gym for Agentic LLMs

Paper • 2510.01051 • Published Oct 1, 2025 • 92

upvoted 4 papers 10 months ago

SimpleTIR: End-to-End Reinforcement Learning for Multi-Turn Tool-Integrated Reasoning

Paper • 2509.02479 • Published Sep 2, 2025 • 84

upvoted a paper about 1 year ago

Lifelong Safety Alignment for Language Models

Paper • 2505.20259 • Published May 26, 2025 • 24

upvoted a paper over 1 year ago

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

Paper • 2501.12948 • Published Jan 22, 2025 • 457

upvoted a paper over 2 years ago

Step-On-Feet Tuning: Scaling Self-Alignment of LLMs via Bootstrapping

Paper • 2402.07610 • Published Feb 12, 2024 • 9

Haoyu Wang

AI & ML interests

Recent Activity

Organizations

Harryis's activity