VISIONx @ NYU

university

https://www.sainingxie.com/

AI & ML interests

None defined yet.

Recent Activity

ZifanZhao2004 authored a paper about 2 hours ago

Cambrian-P: Pose-Grounded Video Understanding

ZifanZhao2004 updated a collection 1 day ago

Cambrian-P Models

ZifanZhao2004 updated a model 1 day ago

nyu-visionx/Cambrian-P-7B-Mix-CamS

View all activity

Papers

Solaris: Building a Multiplayer Video World Model in Minecraft

Scaling Text-to-Image Diffusion Transformers with Representation Autoencoders

View all Papers

nyu-visionx 's models 53

nyu-visionx/Cambrian-P-7B-Mix-CamS

8B • Updated 1 day ago • 14

nyu-visionx/Cambrian-P-7B-Mix-3R

8B • Updated 1 day ago • 8

nyu-visionx/Cambrian-P-7B-Mix-MA

8B • Updated 1 day ago • 14

nyu-visionx/Cambrian-P-7B-32f

8B • Updated 1 day ago • 14

nyu-visionx/Cambrian-P-7B

8B • Updated 1 day ago • 15

nyu-visionx/RAEv2-models

Updated 5 days ago • 2

nyu-visionx/Scale-RAE-Qwen1.5B_DiT2.4B-64ep

Text Generation • 4B • Updated Mar 15 • 83

nyu-visionx/Scale-RAE-Qwen7B_DiT9.8B-64ep

Text Generation • 17B • Updated Mar 15 • 6

nyu-visionx/solaris

Updated Mar 4 • 10

nyu-visionx/RAE-mae-base-p16-ViTXL-n08

Updated Mar 3 • 49

nyu-visionx/RAE-siglip2-base-p16-i256-ViTXL-n08

Updated Mar 3 • 43

nyu-visionx/RAE-dinov2-wReg-large-ViTXL-n08

Updated Mar 3 • 27 • 1

nyu-visionx/RAE-dinov2-wReg-small-ViTXL-n08

Updated Mar 3 • 37

nyu-visionx/RAE-dinov2-wReg-base-ViTXL-n08-i512

Updated Mar 3 • 23

nyu-visionx/RAE-dinov2-wReg-base-ViTXL-n08

Updated Mar 3 • 85

nyu-visionx/RAE-collections

Unconditional Image Generation • Updated Mar 1 • 47

nyu-visionx/dinov2-large_decoder

Updated Feb 7 • 3

nyu-visionx/webmae_decoder

Updated Jan 30 • 10

nyu-visionx/siglip2_decoder

Image-to-Image • Updated Jan 24 • 632

nyu-visionx/webssl300m_decoder

Image-to-Image • Updated Jan 24 • 752

nyu-visionx/Scale-RAE-Qwen1.5B_DiT2.4B-WebSSL

Text-to-Image • 4B • Updated Jan 24 • 9

nyu-visionx/Scale-RAE-Qwen7B_DiT9.8B

Text Generation • 17B • Updated Jan 8 • 6 • 1

nyu-visionx/Scale-RAE-Qwen1.5B_DiT2.4B

Text Generation • 4B • Updated Jan 8 • 661

nyu-visionx/Cambrian-S-3B-S3

3B • Updated Jan 4 • 5

nyu-visionx/Cambrian-S-3B-S2

3B • Updated Jan 4

nyu-visionx/Cambrian-S-3B-S1

3B • Updated Jan 4 • 2

nyu-visionx/Cambrian-S-1.5B-S3

2B • Updated Jan 4 • 6

nyu-visionx/Cambrian-S-1.5B-S2

2B • Updated Jan 4 • 14

nyu-visionx/Cambrian-S-1.5B-S1

2B • Updated Jan 4 • 4.27k

nyu-visionx/Cambrian-S-0.5B-S3

0.9B • Updated Jan 4 • 12