Yansong Shi's picture

Yansong Shi

nanamma

·

https://huggingface.co/nanamma

AI & ML interests

multi modality, video understanding, robotics

Organizations

upvoted 2 papers 4 months ago

Video-o3: Native Interleaved Clue Seeking for Long Video Multi-Hop Reasoning

Paper • 2601.23224 • Published Jan 30 • 4

RIVER: A Real-Time Interaction Benchmark for Video LLMs

Paper • 2603.03985 • Published Mar 4 • 7

upvoted a paper 7 months ago

InternVideo-Next: Towards General Video Foundation Models without Video-Text Supervision

Paper • 2512.01342 • Published Dec 1, 2025 • 21