🤝 Open to Collab

1 11

Siyong Jian

syjian

https://syjmelody.github.io/

AI & ML interests

Computer Vision；Embodied AI；

Recent Activity

upvoted a paper about 16 hours ago

World Action Models: A Survey

upvoted a paper 10 days ago

dMoE: dLLMs with Learnable Block Experts

upvoted a paper 29 days ago

MergeDNA: Context-aware Genome Modeling with Dynamic Tokenization through Token Merging

View all activity

Organizations

None yet

upvoted a paper about 16 hours ago

World Action Models: A Survey

Paper • 2606.20781 • Published 8 days ago • 51

upvoted a paper 10 days ago

dMoE: dLLMs with Learnable Block Experts

Paper • 2605.30876 • Published 28 days ago • 38

upvoted a paper 29 days ago

MergeDNA: Context-aware Genome Modeling with Dynamic Tokenization through Token Merging

Paper • 2511.14806 • Published Nov 17, 2025 • 12

submitted a paper to Daily Papers about 1 month ago

RankE: End-to-End Post-Training for Discrete Text-to-Image Generation with Decoder Co-Evolution

Paper • 2605.21195 • Published May 20 • 19

authored 2 papers about 1 month ago

MergeMix: A Unified Augmentation Paradigm for Visual and Multi-Modal Understanding

Paper • 2510.23479 • Published Oct 27, 2025 • 18

RankE: End-to-End Post-Training for Discrete Text-to-Image Generation with Decoder Co-Evolution

Paper • 2605.21195 • Published May 20 • 19

commented a paper about 1 month ago

RankE: End-to-End Post-Training for Discrete Text-to-Image Generation with Decoder Co-Evolution

Paper • 2605.21195 • Published May 20 • 19 •

upvoted a paper about 1 month ago

RankE: End-to-End Post-Training for Discrete Text-to-Image Generation with Decoder Co-Evolution

Paper • 2605.21195 • Published May 20 • 19

upvoted a paper 3 months ago

LVOmniBench: Pioneering Long Audio-Video Understanding Evaluation for Omnimodal LLMs

Paper • 2603.19217 • Published Mar 19 • 29

upvoted 2 papers 4 months ago

The Trinity of Consistency as a Defining Principle for General World Models

Paper • 2602.23152 • Published Feb 26 • 202

Thinking with Drafting: Optical Decompression via Logical Reconstruction

Paper • 2602.11731 • Published Feb 12 • 36

upvoted a paper 7 months ago

OmniZip: Audio-Guided Dynamic Token Compression for Fast Omnimodal Large Language Models

Paper • 2511.14582 • Published Nov 18, 2025 • 19

upvoted 3 papers 8 months ago

MergeMix: A Unified Augmentation Paradigm for Visual and Multi-Modal Understanding

Paper • 2510.23479 • Published Oct 27, 2025 • 18

OBS-Diff: Accurate Pruning For Diffusion Models in One-Shot

Paper • 2510.06751 • Published Oct 8, 2025 • 22

Which Heads Matter for Reasoning? RL-Guided KV Cache Compression

Paper • 2510.08525 • Published Oct 9, 2025 • 23

Siyong Jian

AI & ML interests

Recent Activity

Organizations

syjian's activity