3 169 67

Urodoc Oncall

UDCAI

AI & ML interests

None yet

Recent Activity

liked a model 2 days ago

krea/Krea-2-Turbo

upvoted a paper 16 days ago

Latent Spatial Memory for Video World Models

upvoted a paper 16 days ago

SCAIL-2: Unifying Controlled Character Animation with End-to-end In-Context Conditioning

View all activity

Organizations

upvoted 2 papers 16 days ago

Latent Spatial Memory for Video World Models

Paper • 2606.09828 • Published 18 days ago • 69

SCAIL-2: Unifying Controlled Character Animation with End-to-end In-Context Conditioning

Paper • 2606.10804 • Published 17 days ago • 49

upvoted a paper about 2 months ago

Step-Audio-R1.5 Technical Report

Paper • 2604.25719 • Published Apr 28 • 15

upvoted 2 papers 2 months ago

OmniShow: Unifying Multimodal Conditions for Human-Object Interaction Video Generation

Paper • 2604.11804 • Published Apr 13 • 72

Strips as Tokens: Artist Mesh Generation with Native UV Segmentation

Paper • 2604.09132 • Published Apr 10 • 56

upvoted 15 papers 3 months ago

Think in Strokes, Not Pixels: Process-Driven Image Generation via Interleaved Reasoning

Paper • 2604.04746 • Published Apr 8 • 73

On-the-fly Repulsion in the Contextual Space for Rich Diversity in Diffusion Transformers

Paper • 2603.28762 • Published Mar 30 • 25

TAPS: Task Aware Proposal Distributions for Speculative Sampling

Paper • 2603.27027 • Published Mar 27 • 145

Kernel-Smith: A Unified Recipe for Evolutionary Kernel Optimization

Paper • 2603.28342 • Published Mar 30 • 26

ImagenWorld: Stress-Testing Image Generation Models with Explainable Human Evaluation on Open-ended Real-World Tasks

Paper • 2603.27862 • Published Mar 29 • 33

Out of Sight but Not Out of Mind: Hybrid Memory for Dynamic Video World Models

Paper • 2603.25716 • Published Mar 26 • 157

PackForcing: Short Video Training Suffices for Long Video Sampling and Long Context Inference

Paper • 2603.25730 • Published Mar 26 • 53

Voxtral TTS

Paper • 2603.25551 • Published Mar 26 • 63

PixelSmile: Toward Fine-Grained Facial Expression Editing

Paper • 2603.25728 • Published Mar 26 • 118

6Bit-Diffusion: Inference-Time Mixed-Precision Quantization for Video Diffusion Models

Paper • 2603.18742 • Published Mar 19 • 11

UniGRPO: Unified Policy Optimization for Reasoning-Driven Visual Generation

Paper • 2603.23500 • Published Mar 24 • 36

TrajLoom: Dense Future Trajectory Generation from Video

Paper • 2603.22606 • Published Mar 23 • 5

Urodoc Oncall

AI & ML interests

Recent Activity

Organizations

UDCAI's activity