7 27 89

Kairun Wen

kairunwen

https://kairunwen.github.io/

AI & ML interests

Computer Vision、Machine Learning

Recent Activity

upvoted a paper 4 days ago

Uni-Edit: Intelligent Editing Is A General Task For Unified Model Tuning

updated a dataset 4 days ago

kairunwen/d4

upvoted a paper 6 days ago

PhysBrain 1.0 Technical Report

View all activity

Organizations

upvoted a paper 4 days ago

Uni-Edit: Intelligent Editing Is A General Task For Unified Model Tuning

Paper • 2605.21487 • Published 5 days ago • 21

upvoted a paper 6 days ago

PhysBrain 1.0 Technical Report

Paper • 2605.15298 • Published 11 days ago • 140

upvoted a paper 11 days ago

Qwen-Image-2.0 Technical Report

Paper • 2605.10730 • Published 14 days ago • 107

upvoted a paper 24 days ago

Claw-Eval-Live: A Live Agent Benchmark for Evolving Real-World Workflows

Paper • 2604.28139 • Published 25 days ago • 42

upvoted a paper about 2 months ago

Thinking in Dynamics: How Multimodal Large Language Models Perceive, Track, and Reason Dynamics in Physical 4D World

Paper • 2603.12746 • Published Mar 13 • 1

upvoted 2 papers 4 months ago

SoMA: A Real-to-Sim Neural Simulator for Robotic Soft-body Manipulation

Paper • 2602.02402 • Published Feb 2 • 32

HY3D-Bench: Generation of 3D Assets

Paper • 2602.03907 • Published Feb 3 • 24

upvoted 4 papers 5 months ago

InfiniteVGGT: Visual Geometry Grounded Transformer for Endless Streams

Paper • 2601.02281 • Published Jan 5 • 33

PhysBrain: Human Egocentric Data as a Bridge from Vision Language Models to Physical Intelligence

Paper • 2512.16793 • Published Dec 18, 2025 • 76

JarvisEvo: Towards a Self-Evolving Photo Editing Agent with Synergistic Editor-Evaluator Optimization

Paper • 2511.23002 • Published Nov 28, 2025 • 26

Ground Slow, Move Fast: A Dual-System Foundation Model for Generalizable Vision-and-Language Navigation

Paper • 2512.08186 • Published Dec 9, 2025 • 23

upvoted a paper 6 months ago

DynamicVerse: A Physically-Aware Multimodal Framework for 4D World Modeling

Paper • 2512.03000 • Published Dec 2, 2025 • 37

upvoted a paper 8 months ago

ARTDECO: Towards Efficient and High-Fidelity On-the-Fly 3D Reconstruction with Structured Scene Representation

Paper • 2510.08551 • Published Oct 9, 2025 • 34

upvoted a paper 10 months ago

StreamVLN: Streaming Vision-and-Language Navigation via SlowFast Context Modeling

Paper • 2507.05240 • Published Jul 7, 2025 • 48

upvoted 2 papers 11 months ago

IR3D-Bench: Evaluating Vision-Language Model Scene Understanding as Agentic Inverse Rendering

Paper • 2506.23329 • Published Jun 29, 2025 • 8

JarvisArt: Liberating Human Artistic Creativity via an Intelligent Photo Retouching Agent

Paper • 2506.17612 • Published Jun 21, 2025 • 65

upvoted 2 papers 12 months ago

PartCrafter: Structured 3D Mesh Generation via Compositional Latent Diffusion Transformers

Paper • 2506.05573 • Published Jun 5, 2025 • 82

SpatialLM: Training Large Language Models for Structured Indoor Modeling

Paper • 2506.07491 • Published Jun 9, 2025 • 51

upvoted 2 papers about 1 year ago

MMaDA: Multimodal Large Diffusion Language Models

Paper • 2505.15809 • Published May 21, 2025 • 98

LightGaussian: Unbounded 3D Gaussian Compression with 15x Reduction and 200+ FPS

Paper • 2311.17245 • Published Nov 28, 2023 • 2

Kairun Wen

AI & ML interests

Recent Activity

Organizations

kairunwen's activity