Zhiyuan Ning

zhiyuan-ning

·

telegraph-pole-head

AI & ML interests

None yet

Organizations

upvoted a paper 3 months ago

The Past Is Not Past: Memory-Enhanced Dynamic Reward Shaping

Paper • 2604.11297 • Published Apr 13 • 144

upvoted a collection 3 months ago

MOSS-VL

5 items • Updated 7 days ago • 60

upvoted 2 papers 4 months ago

Rethinking UMM Visual Generation: Masked Modeling for Efficient Image-Only Pre-training

Paper • 2603.16139 • Published Mar 17 • 33

AI Can Learn Scientific Taste

Paper • 2603.14473 • Published Mar 15 • 432

upvoted 2 papers 5 months ago

SpargeAttention2: Trainable Sparse Attention via Hybrid Top-k+Top-p Masking and Distillation Fine-Tuning

Paper • 2602.13515 • Published Feb 13 • 45

MOVA: Towards Scalable and Synchronized Video-Audio Generation

Paper • 2602.08794 • Published Feb 9 • 159

upvoted 2 papers 7 months ago

DiRL: An Efficient Post-Training Framework for Diffusion Language Models

Paper • 2512.22234 • Published Dec 23, 2025 • 22

Beyond Real: Imaginary Extension of Rotary Position Embeddings for Long-Context LLMs

Paper • 2512.07525 • Published Dec 8, 2025 • 60

upvoted a paper 8 months ago

TiDAR: Think in Diffusion, Talk in Autoregression

Paper • 2511.08923 • Published Nov 12, 2025 • 130

upvoted 2 papers 9 months ago

Thinking with Video: Video Generation as a Promising Multimodal Reasoning Paradigm

Paper • 2511.04570 • Published Nov 6, 2025 • 242

Sparser Block-Sparse Attention via Token Permutation

Paper • 2510.21270 • Published Oct 24, 2025 • 25

upvoted a paper 10 months ago

Energy-Based Transformers are Scalable Learners and Thinkers

Paper • 2507.02092 • Published Jul 2, 2025 • 71

upvoted a paper over 1 year ago

PRIMA.CPP: Speeding Up 70B-Scale LLM Inference on Low-Resource Everyday Home Clusters

Paper • 2504.08791 • Published Apr 7, 2025 • 141