Edit Models filters

Model Tree

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

442

Base only

Active filters: fp4

nvidia/Qwen3.6-27B-NVFP4

Text Generation • 18B • Updated 11 days ago • 841k • 342

nvidia/GLM-5.2-NVFP4

Text Generation • 381B • Updated 15 days ago • 833k • 260

nvidia/Qwen3.6-35B-A3B-NVFP4

Text Generation • 19B • Updated 29 days ago • 8.31M • 455

nvidia/Qwen3.5-122B-A10B-NVFP4

Text Generation • 65B • Updated Jun 2 • 102k • 39

nvidia/Kimi-K2.7-Code-NVFP4

Text Generation • Updated 5 days ago • 15.3k • 5

OpenYourMind/Qwopus3.5-122B-A10B-Kimi-K2.6-destilled-abliterated-NVFP4

Image-Text-to-Text • 74B • Updated 25 days ago • 10.6k • 10

SergiusFlavius/Qwen3-VL-4B-Instruct-heretic-NVFP4

Image-Text-to-Text • Updated 10 days ago • 5

williamliao/Qwen3.6-27B-NVFP4-GGUF

Text Generation • 27B • Updated 11 days ago • 8.44k • 15

AEON-7/Qwen3.6-35B-A3B-heretic-NVFP4

Image-Text-to-Text • 21B • Updated 13 days ago • 201k • 60

maci0/Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-NVFP4

Image-Text-to-Text • 23B • Updated 5 days ago • 3.11k • 9

N8Programs/Qwen3.6-35B-A3B-AntiLoop-NVFP4

Text Generation • 19B • Updated 1 day ago • 475 • 3

migtissera/Tess-4-27B-NVFP4

Image-Text-to-Text • 17B • Updated 1 day ago • 101 • 3

nvidia/Qwen3-Coder-480B-A35B-Instruct-NVFP4

Text Generation • 241B • Updated Feb 5 • 1.03k • 15

nvidia/GLM-5.1-NVFP4

Text Generation • 382B • Updated May 27 • 76.1k • 41

0xSero/Hy3-299B-NVFP4

Text Generation • 169B • Updated May 30 • 326 • 4

maci0/Qwopus3.6-27B-Coder-NVFP4

Image-Text-to-Text • 16B • Updated 5 days ago • 71.2k • 2

sanskar003/Qwen3.5-4B-NVFP4

Image-Text-to-Text • 4B • Updated 10 days ago • 98 • 4

morosystems/ThinkingCap-Qwen3.6-27B-NVFP4

Image-Text-to-Text • 15B • Updated 3 days ago • 2.16k • 2

RedHatAI/Llama-3.1-70B-Instruct-NVFP4

Text Generation • 41B • Updated Nov 21, 2025 • 646 • 1

nvidia/Llama-3.1-8B-Instruct-NVFP4

5B • Updated Sep 15, 2025 • 280k • 13

nvidia/Qwen3-8B-NVFP4

Text Generation • 5B • Updated Sep 9, 2025 • 184k • 20

RedHatAI/Llama-3.1-8B-Instruct-NVFP4

Text Generation • 5B • Updated Nov 21, 2025 • 20.5k • 2

RedHatAI/Mistral-Small-3.2-24B-Instruct-2506-NVFP4

Text Generation • 14B • Updated Dec 4, 2025 • 6.04k • 10

nvidia/GLM-5-NVFP4

Text Generation • 435B • Updated Apr 10 • 36.3k • 30

RedHatAI/gemma-4-31B-it-NVFP4

Image-Text-to-Text • 20B • Updated 1 day ago • 515k • 53

OptimizeLLM/Qwen3.5-122B-A10B-heretic-MTP-NVFP4

Text Generation • 74B • Updated Apr 11 • 13k • 8

AEON-7/Gemma-4-31B-it-DECKARD-HERETIC-Uncensored-NVFP4

Text Generation • 18B • Updated 21 days ago • 3.33k • 11

FreedomAISVR/Gemma-4-26B-A4B-it-NVFP4-GGUF

Text Generation • 25B • Updated May 20 • 602 • 3

trohrbaugh/gemma-4-31b-it-heretic-ara-NVFP4

Image-Text-to-Text • 22B • Updated about 1 month ago • 622 • 1

maci0/Huihui-Qwythos-9B-Claude-Mythos-5-1M-abliterated-NVFP4

Image-Text-to-Text • 6B • Updated 5 days ago • 459 • 3