VISIONx @ NYU

university

https://www.sainingxie.com/

AI & ML interests

None defined yet.

Recent Activity

xcpan authored a paper about 21 hours ago

RepFusion: Leveraging Multimodal Priors for Denoising in Representation Space

sihyun-yu authored a paper 3 days ago

Video Probabilistic Diffusion Models in Projected Latent Space

sihyun-yu authored a paper 3 days ago

Controllable Human Image Generation with Personalized Multi-Garments

View all activity

Papers

Benchmarking Visual State Tracking in Multimodal Video Understanding

PaintBench: Deterministic Evaluation of Precise Visual Editing

View all Papers

nyu-visionx 's models 53

nyu-visionx/Cambrian-P-7B-Mix-CamS

8B • Updated 30 days ago • 30

nyu-visionx/Cambrian-P-7B-Mix-3R

8B • Updated 30 days ago • 94

nyu-visionx/Cambrian-P-7B-Mix-MA

8B • Updated 30 days ago • 30

nyu-visionx/Cambrian-P-7B-32f

8B • Updated 30 days ago • 82

nyu-visionx/Cambrian-P-7B

8B • Updated 30 days ago • 167 • 1

nyu-visionx/RAEv2-models

Updated May 18 • 3

nyu-visionx/Scale-RAE-Qwen1.5B_DiT2.4B-64ep

Text Generation • 4B • Updated Mar 15 • 15

nyu-visionx/Scale-RAE-Qwen7B_DiT9.8B-64ep

Text Generation • 17B • Updated Mar 15 • 5

nyu-visionx/solaris

Updated Mar 4 • 11

nyu-visionx/RAE-mae-base-p16-ViTXL-n08

Updated Mar 3 • 25

nyu-visionx/RAE-siglip2-base-p16-i256-ViTXL-n08

Updated Mar 3 • 21

nyu-visionx/RAE-dinov2-wReg-large-ViTXL-n08

Updated Mar 3 • 25 • 1

nyu-visionx/RAE-dinov2-wReg-small-ViTXL-n08

Updated Mar 3 • 29

nyu-visionx/RAE-dinov2-wReg-base-ViTXL-n08-i512

Updated Mar 3 • 40

nyu-visionx/RAE-dinov2-wReg-base-ViTXL-n08

Updated Mar 3 • 66

nyu-visionx/RAE-collections

Unconditional Image Generation • Updated Mar 1 • 47

nyu-visionx/dinov2-large_decoder

Updated Feb 7 • 5

nyu-visionx/webmae_decoder

Updated Jan 30 • 5

nyu-visionx/siglip2_decoder

Image-to-Image • Updated Jan 24 • 2.87k

nyu-visionx/webssl300m_decoder

Image-to-Image • Updated Jan 24 • 1.15k

nyu-visionx/Scale-RAE-Qwen1.5B_DiT2.4B-WebSSL

Text-to-Image • 4B • Updated Jan 24 • 1.94k

nyu-visionx/Scale-RAE-Qwen7B_DiT9.8B

Text Generation • 17B • Updated Jan 8 • 42 • 1

nyu-visionx/Scale-RAE-Qwen1.5B_DiT2.4B

Text Generation • 4B • Updated Jan 8 • 6.24k

nyu-visionx/Cambrian-S-3B-S3

3B • Updated Jan 4 • 3

nyu-visionx/Cambrian-S-3B-S2

3B • Updated Jan 4 • 2

nyu-visionx/Cambrian-S-3B-S1

3B • Updated Jan 4 • 3

nyu-visionx/Cambrian-S-1.5B-S3

2B • Updated Jan 4 • 8

nyu-visionx/Cambrian-S-1.5B-S2

2B • Updated Jan 4 • 8

nyu-visionx/Cambrian-S-1.5B-S1

2B • Updated Jan 4 • 10

nyu-visionx/Cambrian-S-0.5B-S3

0.9B • Updated Jan 4 • 3