lvfeng

LF02

·

AI & ML interests

None yet

Recent Activity

liked a dataset 7 days ago

leonardPKU/clevr_cogen_a_train

liked a model 8 days ago

nvidia/LocateAnything-3B

liked a dataset 10 days ago

terryoo/TableVQA-Bench

View all activity

Organizations

None yet

upvoted a paper 21 days ago

Struct-Searcher: Agentic Structural Thinking Advances Multimodal Deep Information Seeking

Paper • 2606.07689 • Published 26 days ago • 5

upvoted 2 papers 5 months ago

ERNIE 5.0 Technical Report

Paper • 2602.04705 • Published Feb 4 • 269

Green-VLA: Staged Vision-Language-Action Model for Generalist Robots

Paper • 2602.00919 • Published Jan 31 • 323

upvoted 2 papers 7 months ago

Z-Image: An Efficient Image Generation Foundation Model with Single-Stream Diffusion Transformer

Paper • 2511.22699 • Published Nov 27, 2025 • 248

RealGen: Photorealistic Text-to-Image Generation via Detector-Guided Rewards

Paper • 2512.00473 • Published Nov 29, 2025 • 27

upvoted 3 papers 8 months ago

Diffusion Transformers with Representation Autoencoders

Paper • 2510.11690 • Published Oct 13, 2025 • 171

RAG-Anything: All-in-One RAG Framework

Paper • 2510.12323 • Published Oct 14, 2025 • 82

PaddleOCR-VL: Boosting Multilingual Document Parsing via a 0.9B Ultra-Compact Vision-Language Model

Paper • 2510.14528 • Published Oct 16, 2025 • 129

upvoted a paper 10 months ago

RT-DATR:Real-time Unsupervised Domain Adaptive Detection Transformer with Adversarial Feature Learning

Paper • 2504.09196 • Published Apr 12, 2025 • 1

upvoted an article about 1 year ago

Article

Instruction-tuning Stable Diffusion with InstructPix2Pix

sayakpaul

•

May 23, 2023

• 19