Edit Models filters

Model Tree

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

447

Base only

Active filters: fp4

maci0/Qwopus3.6-27B-Coder-NVFP4

Image-Text-to-Text • 16B • Updated 8 days ago • 151k • 2

greghavens/fabletron-nemotron-3-super-120b-NVFP4

Text Generation • 63B • Updated 2 days ago • 929 • 1

sanskar003/Qwen3.5-4B-NVFP4

Image-Text-to-Text • 4B • Updated 13 days ago • 498 • 4

SergiusFlavius/Qwen3-VL-8B-Instruct-heretic-NVFP4

Image-Text-to-Text • Updated 13 days ago • 1

maci0/Qwopus3.6-27B-Coder-abliterated-NVFP4

Image-Text-to-Text • 16B • Updated 8 days ago • 255 • 1

Brooooooklyn/Gemma-4-26B-A4B-NVFP4-mlx

Text Generation • 9B • Updated 9 days ago • 399 • 1

Cadododoom/Agents-A1-TextOnly-FP4

18B • Updated 5 days ago • 189 • 2

sahilchachra/ThinkingCap-Qwen3.6-27B-NVFP4A16

Text Generation • 20B • Updated 7 days ago • 431 • 1

kamiyugi/Leanstral-1.5-119B-A6B-NVFP4A16

Text Generation • Updated 7 days ago • 27 • 1

sanskar003/Qwen3.5-9B-NVFP4

Image-Text-to-Text • 6B • Updated 6 days ago • 185 • 2

Hadidiz9/GUI-Owl-1.5-32B-Instruct-NVFP4

Image-Text-to-Text • 20B • Updated 5 days ago • 41 • 1

protoLabsAI/LTX-2.3-22B-distilled-NVFP4

Text-to-Video • Updated 1 day ago • 1

mengqin1/RedidreamNSFWI1-bnb-4bit

Updated May 10, 2025 • 1

qingcheng-ai/QwQ-32B-fp4

Text Generation • 19B • Updated Jun 24, 2025 • 6 • 3

qingcheng-ai/Qwen3-32B-fp4

Text Generation • 19B • Updated May 19, 2025 • 136 • 4

qingcheng-ai/Qwen3-8B-fp4

Text Generation • 5B • Updated May 19, 2025 • 16 • 1

RedHatAI/Qwen3-30B-A3B-NVFP4

Text Generation • 17B • Updated Dec 4, 2025 • 27.8k • 2

RedHatAI/Llama-3.1-70B-Instruct-NVFP4A16

Text Generation • 41B • Updated Jun 30, 2025 • 33

RedHatAI/Qwen3-32B-NVFP4

Text Generation • 19B • Updated Nov 21, 2025 • 3.22k • 9

RedHatAI/Qwen3-32B-NVFP4A16

Text Generation • 19B • Updated Jun 30, 2025 • 332 • 2

nvidia/Qwen3-235B-A22B-NVFP4

Text Generation • 133B • Updated Jul 8, 2025 • 15.4k • 18

nvidia/Qwen3-30B-A3B-NVFP4

Text Generation • 16B • Updated Sep 10, 2025 • 81.1k • 37

RedHatAI/Llama-4-Scout-17B-16E-Instruct-NVFP4

Text Generation • 64B • Updated Nov 21, 2025 • 1.04k • 1

apolloparty/Qwen3-4B-NVFP4A16

2B • Updated Jul 12, 2025 • 5

Tonic/petite-elle-L-aime-3-sft

Text Generation • 3B • Updated Aug 2, 2025 • 22 • 1

mradermacher/petite-elle-L-aime-3-sft-GGUF

Text Generation • 3B • Updated Jul 29, 2025 • 127 • 1

nm-testing/DeepSeek-R1-Distill-Qwen-32B-NVFP4

Text Generation • 19B • Updated Nov 21, 2025 • 2.61k • 3

2imi9/Qwen3-4B-NVFP4A16

Text Generation • 2B • Updated Aug 27, 2025 • 6

2imi9/Qwen3-1.7B-NVFP4A16

Text Generation • 1B • Updated Aug 27, 2025 • 6 • 1

ELVISIO/Qwen3-8B-NVFP4A16

Text Generation • 5B • Updated Aug 4, 2025 • 51