Edit Models filters

Model Tree

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

746

Base only

Active filters: modelopt

sakamakismile/Krea-2-Turbo-NVFP4-AWQ

Text-to-Image • Updated 10 days ago • 186 • 4

williamliao/Qwen3.6-35B-A3B-NVFP4-GGUF

Text Generation • 36B • Updated 5 days ago • 439 • 2

nvidia/Phi-4-reasoning-plus-NVFP4

8B • Updated Sep 5, 2025 • 472k • 11

nvidia/Llama-3.1-8B-Instruct-NVFP4

5B • Updated Sep 15, 2025 • 281k • 12

nvidia/Qwen3-8B-NVFP4

Text Generation • 5B • Updated Sep 9, 2025 • 149k • 18

nvidia/Qwen3-Next-80B-A3B-Thinking-NVFP4

Text Generation • Updated Feb 9 • 2.94k • 63

AxionML/Qwen3.5-122B-A10B-NVFP4

Image-Text-to-Text • 62B • Updated Mar 3 • 162 • 6

AxionML/Qwen3.5-4B-NVFP4

Image-Text-to-Text • 3B • Updated Mar 3 • 4.7k • 5

lukealonso/Qwen3.5-397B-A17B-NVFP4

Text Generation • Updated Apr 12 • 3.11k • 10

nvidia/GLM-4.7-NVFP4

Text Generation • 183B • Updated Mar 25 • 6.01k • 16

LilaRest/gemma-4-31B-it-NVFP4-turbo

Text Generation • 33B • Updated Apr 10 • 175k • 298

AEON-7/Gemma-4-E4B-DECKARD-HERETIC-NVFP4

Text Generation • 6B • Updated 15 days ago • 19.6k • 1

AEON-7/Gemma-4-E4B-it-Uncensored-NVFP4

Text Generation • 6B • Updated 15 days ago • 149 • 3

nvidia/MiniMax-M2.7-NVFP4

Text Generation • 116B • Updated Apr 24 • 106k • 61

catplusplus/MiniMax-M2.7-REAP-172B-A10B-NVFP4

Text Generation • 116B • Updated Apr 18 • 28 • 3

nvidia/Nemotron-3-Nano-Omni-30B-A3B-Reasoning-FP8

Any-to-Any • 33B • Updated May 5 • 109k • 58

sakamakismile/Qwen3.6-27B-Text-NVFP4-MTP

Text Generation • 17B • Updated Apr 29 • 339k • 79

sakamakismile/Huihui-Qwen3.6-27B-abliterated-NVFP4-TEXT-MTP

Text Generation • 17B • Updated Apr 29 • 5.04k • 7

AEON-7/Nemotron-3-Nano-Omni-AEON-Ultimate-Uncensored-NVFP4

Any-to-Any • 20B • Updated 15 days ago • 878 • 8

llmfan46/Qwen3.6-27B-uncensored-heretic-v2-Native-MTP-Preserved-NVFP4-GGUF

Image-Text-to-Text • 27B • Updated May 7 • 14k • 30

nvidia/Kimi-K2.6-NVFP4

Text Generation • Updated May 15 • 789k • 40

natfii/Qwen3.6-27B-VLM-NVFP4-MTP

Image-Text-to-Text • 17B • Updated 25 days ago • 3.1k • 5

brandonmusic/MiniMax-M3-NVFP4

246B • Updated 21 days ago • 14.9k • 10

r0b0tlab/VibeThinker-3B-NVFP4

Text Generation • 2B • Updated 19 days ago • 712 • 3

Mapika/GLM-5.2-NVFP4

Text Generation • 379B • Updated 18 days ago • 11.1k • 5

madeby561/GLM-5.2-NVFP4-REAP-504B

Text Generation • 290B • Updated 14 days ago • 686 • 9

brandonmusic/GLM-5.2-NVFP4-REAP-Recall-N172

Text Generation • 296B • Updated 8 days ago • 2.49k • 6

sant1an/GLM-5.2-NVFP4-MTP

Text Generation • Updated 10 days ago • 60 • 1

sakamakismile/Krea-2-Turbo-FP8

Text-to-Image • Updated 10 days ago • 119 • 1

nerkyor/Qwen3.6-27B-DSV4Pro-Thinking-Distill-NVFP4

Text Generation • 19B • Updated 7 days ago • 373 • 3