Edit Models filters

Model Tree

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

740

Base only

Active filters: modelopt

nvidia/Qwen3.6-27B-NVFP4

Text Generation • 18B • Updated 3 days ago • 94.5k • 220

nvidia/GLM-5.2-NVFP4

Text Generation • 381B • Updated 7 days ago • 190k • 211

nvidia/Qwen3.6-35B-A3B-NVFP4

Text Generation • 19B • Updated 21 days ago • 6.22M • 417

nvidia/MiniMax-M3-NVFP4

Text Generation • 247B • Updated 7 days ago • 43.3k • 47

0xSero/GLM-5.2-504B-Nvidia

Text Generation • 293B • Updated 7 days ago • 785 • 19

nvidia/Mistral-Medium-3.5-128B-NVFP4

Text Generation • 84B • Updated 2 days ago • 2.22k • 18

nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-NVFP4

Text Generation • 335B • Updated 9 days ago • 484k • • 233

OpenYourMind/GLM-5.2-abliterated

432B • Updated 4 days ago • 19

nvidia/NVIDIA-Nemotron-3-Super-120B-A12B-NVFP4

Text Generation • 67B • Updated May 1 • 960k • 375

nvidia/Gemma-4-26B-A4B-NVFP4

Text Generation • 14B • Updated May 11 • 2.2M • 107

0xSero/GLM-5.2-504B

Text Generation • 290B • Updated 8 days ago • 18k • 28

williamliao/Qwen3.6-27B-NVFP4-GGUF

Text Generation • 27B • Updated 3 days ago • 1.79k • 10

nvidia/Qwen3.5-122B-A10B-NVFP4

Text Generation • 65B • Updated about 1 month ago • 63.6k • 27

stepfun-ai/Step-3.7-Flash-NVFP4

Image-Text-to-Text • 104B • Updated Jun 1 • 297k • 58

nvidia/diffusiongemma-26B-A4B-it-NVFP4

Text Generation • 14B • Updated 23 days ago • 1.37M • 90

madeby561/GLM-5.2-NVFP4-REAP-504B-term

Text Generation • 290B • Updated 3 days ago • 1.84k • 16

DJLougen/Qwable-5-27B-Coder-NVFP4

Text Generation • 15B • Updated 10 days ago • 785 • 10

sakamakismile/Krea-2-Turbo-NVFP4-AWQ

Text-to-Image • Updated 8 days ago • 136 • 3

nerkyor/Qwen3.6-27B-DSV4Pro-Thinking-Distill-NVFP4

Text Generation • 19B • Updated 5 days ago • 286 • 3

AEON-7/supergemma4-26b-abliterated-multimodal-nvfp4

Text Generation • 15B • Updated 12 days ago • 220 • 6

AEON-7/gemma-4-31B-it-speculator.eagle3-NVFP4

Text Generation • 2B • Updated 12 days ago • 394 • 5

nvidia/Nemotron-3-Nano-Omni-30B-A3B-Reasoning-NVFP4

Any-to-Any • 18B • Updated May 5 • 2.09M • 148

AEON-7/Qwen3.6-27B-AEON-Ultimate-Uncensored-Multimodal-NVFP4-MTP

Text Generation • 20B • Updated about 6 hours ago • 37.2k • 23

lukealonso/MiMo-V2.5-NVFP4

179B • Updated May 11 • 35.5k • 22

Hcompany/Holo-3.1-35B-A3B-NVFP4

Image-Text-to-Text • 19B • Updated about 1 month ago • 41.3k • 36

lukealonso/GLM-5.2-NVFP4

Text Generation • 432B • Updated 16 days ago • 82.7k • 28

Luni/Ornith-1.0-9B-NVFP4-AWQ

Text Generation • 6B • Updated 7 days ago • 2.91k • 3

ressl/Ornith-1.0-35B-NVFP4

19B • Updated 3 days ago • 234 • 2

williamliao/Qwen3.6-35B-A3B-NVFP4-GGUF

Text Generation • 36B • Updated 3 days ago • 317 • 2

NVFP4/Qwen3-Coder-30B-A3B-Instruct-FP4

Text Generation • 16B • Updated Aug 5, 2025 • 10.9k • 36