Models
Datasets
Spaces
Buckets new
Docs
Enterprise
Pricing
- Website
- Community
- Solutions
Log In
Sign Up

Xiaoran Fan's picture

Xiaoran Fan

cnxup

21world's profile picture

·

AI & ML interests

NLP, CV, LLM

Organizations

None yet

cnxup 's collections 1

The MHA2MLA-VLM model published in the paper "MHA2MLA-VLM: Enabling DeepSeek's Economical Multi-Head Latent Attention across Vision-Language Models"

cnxup/Qwen2.5-VL-7B-MLA-stage1-rope32

8B • Updated Jan 23 • 10 • 1
cnxup/Qwen2.5-VL-7B-MLA-stage2-rope32-d_kv_32

8B • Updated Jan 27 • 2 • 1
cnxup/Qwen2.5-VL-7B-MLA-stage2-rope32-d_kv_64

8B • Updated Jan 27 • 3 • 1
cnxup/Qwen2.5-VL-7B-MLA-stage2-rope32-d_kv_128

8B • Updated Jan 27 • 4 • 1

The MHA2MLA-VLM model published in the paper "MHA2MLA-VLM: Enabling DeepSeek's Economical Multi-Head Latent Attention across Vision-Language Models"

cnxup/Qwen2.5-VL-7B-MLA-stage1-rope32

8B • Updated Jan 23 • 10 • 1
cnxup/Qwen2.5-VL-7B-MLA-stage2-rope32-d_kv_32

8B • Updated Jan 27 • 2 • 1
cnxup/Qwen2.5-VL-7B-MLA-stage2-rope32-d_kv_64

8B • Updated Jan 27 • 3 • 1
cnxup/Qwen2.5-VL-7B-MLA-stage2-rope32-d_kv_128

8B • Updated Jan 27 • 4 • 1

Company

TOS Privacy About Careers

Website

Models Datasets Spaces Pricing Docs