2 15 8

Zhuofan Zong PRO

zongzhuofan

AI & ML interests

None yet

Recent Activity

upvoted a paper about 16 hours ago

FullStack-Agent: Enhancing Agentic Full-Stack Web Coding via Development-Oriented Testing and Repository Back-Translation

upvoted a paper 23 days ago

DrivingGen: A Comprehensive Benchmark for Generative Video World Models in Autonomous Driving

upvoted a paper 2 months ago

DraCo: Draft as CoT for Text-to-Image Preview and Rare Concept Generation

View all activity

Organizations

upvoted a paper about 16 hours ago

FullStack-Agent: Enhancing Agentic Full-Stack Web Coding via Development-Oriented Testing and Repository Back-Translation

Paper • 2602.03798 • Published 1 day ago • 9

upvoted a paper 23 days ago

DrivingGen: A Comprehensive Benchmark for Generative Video World Models in Autonomous Driving

Paper • 2601.01528 • Published Jan 4 • 19

upvoted a paper 2 months ago

DraCo: Draft as CoT for Text-to-Image Preview and Rare Concept Generation

Paper • 2512.05112 • Published Dec 4, 2025 • 12

updated a model 7 months ago

zongzhuofan/EasyRef

Text-to-Image • Updated Jul 15, 2025 • 8 • 3

authored a paper 9 months ago

T2I-R1: Reinforcing Image Generation with Collaborative Semantic-level and Token-level CoT

Paper • 2505.00703 • Published May 1, 2025 • 44

upvoted a paper 9 months ago

T2I-R1: Reinforcing Image Generation with Collaborative Semantic-level and Token-level CoT

Paper • 2505.00703 • Published May 1, 2025 • 44

upvoted a paper 12 months ago

MME-CoT: Benchmarking Chain-of-Thought in Large Multimodal Models for Reasoning Quality, Robustness, and Efficiency

Paper • 2502.09621 • Published Feb 13, 2025 • 28

updated a Space about 1 year ago

EasyRef

🏃

Generate images based on reference images and prompts

liked a Space about 1 year ago

EasyRef

🏃

Generate images based on reference images and prompts

updated a model about 1 year ago

zongzhuofan/co-detr-vit-large-coco-instance

Image Segmentation • Updated Dec 29, 2024 • 2

authored a paper about 1 year ago

VividFace: A Diffusion-Based Hybrid Framework for High-Fidelity Video Face Swapping

Paper • 2412.11279 • Published Dec 15, 2024 • 13

upvoted 2 papers about 1 year ago

VividFace: A Diffusion-Based Hybrid Framework for High-Fidelity Video Face Swapping

Paper • 2412.11279 • Published Dec 15, 2024 • 13

Causal Diffusion Transformers for Generative Modeling

Paper • 2412.12095 • Published Dec 16, 2024 • 23

authored a paper about 1 year ago

EasyRef: Omni-Generalized Group Image Reference for Diffusion Models via Multimodal LLM

Paper • 2412.09618 • Published Dec 12, 2024 • 21

updated a collection about 1 year ago

EasyRef

Collection

Demo: https://easyref-gen.github.io/ • 1 item • Updated Dec 13, 2024

liked a model about 1 year ago

zongzhuofan/EasyRef

Text-to-Image • Updated Jul 15, 2025 • 8 • 3

commented a paper about 1 year ago

EasyRef: Omni-Generalized Group Image Reference for Diffusion Models via Multimodal LLM

Paper • 2412.09618 • Published Dec 12, 2024 • 21 •

upvoted 2 papers about 1 year ago

EasyRef: Omni-Generalized Group Image Reference for Diffusion Models via Multimodal LLM

Paper • 2412.09618 • Published Dec 12, 2024 • 21

StreamChat: Chatting with Streaming Video

Paper • 2412.08646 • Published Dec 11, 2024 • 18

liked a model about 1 year ago

zongzhuofan/co-detr-vit-large-coco

Image Segmentation • Updated Jul 21, 2024 • 8

Zhuofan Zong PRO

AI & ML interests

Recent Activity

Organizations

zongzhuofan's activity

EasyRef

EasyRef