Haowei Zhang's picture

Haowei Zhang

freesky

·

freesky01

AI & ML interests

None yet

Recent Activity

upvoted a paper about 1 month ago

World Action Models: The Next Frontier in Embodied AI

upvoted a paper about 2 months ago

ARIS: Autonomous Research via Adversarial Multi-Agent Collaboration

upvoted a paper about 2 months ago

From Skills to Talent: Organising Heterogeneous Agents as a Real-World Company

View all activity

Organizations

upvoted a paper about 1 month ago

World Action Models: The Next Frontier in Embodied AI

Paper • 2605.12090 • Published May 12 • 68

upvoted 2 papers about 2 months ago

ARIS: Autonomous Research via Adversarial Multi-Agent Collaboration

Paper • 2605.03042 • Published May 4 • 140

From Skills to Talent: Organising Heterogeneous Agents as a Real-World Company

Paper • 2604.22446 • Published Apr 24 • 124

upvoted a paper 2 months ago

The Past Is Not Past: Memory-Enhanced Dynamic Reward Shaping

Paper • 2604.11297 • Published Apr 13 • 144

upvoted 3 papers 3 months ago

DataFlex: A Unified Framework for Data-Centric Dynamic Training of Large Language Models

Paper • 2603.26164 • Published Mar 27 • 365

PackForcing: Short Video Training Suffices for Long Video Sampling and Long Context Inference

Paper • 2603.25730 • Published Mar 26 • 53

AI Can Learn Scientific Taste

Paper • 2603.14473 • Published Mar 15 • 431

upvoted 4 papers 4 months ago

BandPO: Bridging Trust Regions and Ratio Clipping via Probability-Aware Bounds for LLM Reinforcement Learning

Paper • 2603.04918 • Published Mar 5 • 56

A Very Big Video Reasoning Suite

Paper • 2602.20159 • Published Feb 23 • 526

MOSS-Audio-Tokenizer: Scaling Audio Tokenizers for Future Audio Foundation Models

Paper • 2602.10934 • Published Feb 11 • 50

Prism: Spectral-Aware Block-Sparse Attention

Paper • 2602.08426 • Published Feb 9 • 38

upvoted 9 papers 5 months ago

MOVA: Towards Scalable and Synchronized Video-Audio Generation

Paper • 2602.08794 • Published Feb 9 • 159

Making Avatars Interact: Towards Text-Driven Human-Object Interaction for Controllable Talking Avatars

Paper • 2602.01538 • Published Feb 2 • 15

Vision-DeepResearch Benchmark: Rethinking Visual and Textual Search for Multimodal Large Language Models

Paper • 2602.02185 • Published Feb 2 • 118

UniReason 1.0: A Unified Reasoning Framework for World Knowledge Aligned Image Generation and Editing

Paper • 2602.02437 • Published Feb 2 • 80

AgentLongBench: A Controllable Long Benchmark For Long-Contexts Agents via Environment Rollouts

Paper • 2601.20730 • Published Jan 28 • 21

TL-GRPO: Turn-Level RL for Reasoning-Guided Iterative Optimization

Paper • 2601.16480 • Published Jan 23 • 50

Learning to Discover at Test Time

Paper • 2601.16175 • Published Jan 22 • 45

Qwen3-TTS Technical Report

Paper • 2601.15621 • Published Jan 22 • 77

Live Avatar: Streaming Real-time Audio-Driven Avatar Generation with Infinite Length

Paper • 2512.04677 • Published Dec 4, 2025 • 178