2 18

Soroush Mehraban

SoroushMehraban

AI & ML interests

None yet

Recent Activity

upvoted a paper about 1 month ago

SEGA: Spectral-Energy Guided Attention for Resolution Extrapolation in Diffusion Transformers

upvoted a paper 2 months ago

HY-World 2.0: A Multi-Modal World Model for Reconstructing, Generating, and Simulating 3D Worlds

upvoted a paper 3 months ago

Woosh: A Sound Effects Foundation Model

View all activity

Organizations

upvoted a paper about 1 month ago

SEGA: Spectral-Energy Guided Attention for Resolution Extrapolation in Diffusion Transformers

Paper • 2605.22668 • Published May 21 • 40

upvoted a paper 2 months ago

HY-World 2.0: A Multi-Modal World Model for Reconstructing, Generating, and Simulating 3D Worlds

Paper • 2604.14268 • Published Apr 15 • 127

upvoted 2 papers 3 months ago

Woosh: A Sound Effects Foundation Model

Paper • 2604.01929 • Published Apr 2 • 12

Steerable Visual Representations

Paper • 2604.02327 • Published Apr 2 • 56

upvoted 6 papers 4 months ago

DyaDiT: A Multi-Modal Diffusion Transformer for Socially Favorable Dyadic Gesture Generation

Paper • 2602.23165 • Published Feb 26 • 3

LoopFormer: Elastic-Depth Looped Transformers for Latent Reasoning via Shortcut Modulation

Paper • 2602.11451 • Published Feb 11 • 16

updated a dataset 5 months ago

Pickford/PickStyle-Dataset

Viewer • Updated Jan 21 • 801 • 2.15k • 1

upvoted a paper 6 months ago

LTX-2: Efficient Joint Audio-Visual Foundation Model

Paper • 2601.03233 • Published Jan 6 • 183

updated a model 6 months ago

Pickford/PickStyle

Updated Dec 31, 2025

published a model 6 months ago

Pickford/PickStyle

Updated Dec 31, 2025

published a dataset 6 months ago

Pickford/PickStyle-Dataset

Viewer • Updated Jan 21 • 801 • 2.15k • 1

upvoted 4 papers 6 months ago

Animate Any Character in Any World

Paper • 2512.17796 • Published Dec 18, 2025 • 12

EasyV2V: A High-quality Instruction-based Video Editing Framework

Paper • 2512.16920 • Published Dec 18, 2025 • 18

PuzzleCraft: Exploration-Aware Curriculum Learning for Puzzle-Based RLVR in VLMs

Paper • 2512.14944 • Published Mar 13 • 36

CRISP: Contact-Guided Real2Sim from Monocular Video with Planar Scene Primitives

Paper • 2512.14696 • Published Dec 16, 2025 • 8

authored a paper 7 months ago

FastHMR: Accelerating Human Mesh Recovery via Token and Layer Merging with Diffusion Decoding

Paper • 2510.10868 • Published Oct 13, 2025 • 13

Soroush Mehraban

AI & ML interests

Recent Activity

Organizations

SoroushMehraban's activity