Edit Models filters

Model Tree

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

749

Base only

Active filters: modelopt

tpoisonooo/dual0326

5B • Updated Mar 26 • 1

eva20150932-atlascloud/Tongyi-DeepResearch-30B-A3B-FP8

31B • Updated Mar 26 • 1

tpoisonooo/dual0326-fpint

5B • Updated Mar 26 • 2

trohrbaugh/Nemotron-Cascade-2-30B-A3B-heretic-ara-FP8

Text Generation • 32B • Updated Apr 14 • 17

RedHatAI/NVIDIA-Nemotron-3-Super-120B-A12B-FP8

Text Generation • 124B • Updated Apr 28 • 652 • 1

RedHatAI/NVIDIA-Nemotron-3-Super-120B-A12B-NVFP4

Text Generation • 67B • Updated 19 days ago • 2.06k • 2

Inferact/MiniMax-M2.5-NVFP4

130B • Updated Mar 27 • 19

arcee-ai/Trinity-Large-Preview-NVFP4

Text Generation • 202B • Updated May 28 • 23 • 1

avagridworkit/NVIDIA-Nemotron-3-Super-120B-A12B-FP8

Text Generation • 124B • Updated Mar 28 • 5

w341e/MiniMax-M2.5-NVFP4

130B • Updated Mar 29 • 5

KumaOxO/NVIDIA-Nemotron-3-Super-120B-A12B-FP8

Text Generation • 124B • Updated Mar 29 • 4

zack203002/NVIDIA-Nemotron-3-Super-120B-A12B-NVFP4

Text Generation • 67B • Updated Mar 31 • 4

ramblingpolymath/Qwen3-4B-Instruct-2507-FP8

4B • Updated Mar 31 • 3

LifetimeMistake/Qwen3-VL-Embedding-2B-NVFP4

Feature Extraction • 2B • Updated Mar 31 • 560 • 1

Kaxanie/NVIDIA-Nemotron-3-Super-120B-A12B-NVFP4

Text Generation • 67B • Updated Mar 31 • 283

Yuqi123/Qwen3-4B-modelopt-fp8

4B • Updated Apr 1 • 2

tianrui6641/tais_coder_mini_36b_a3b_core_generalist-merged-MXFP4

18B • Updated Apr 1 • 1

tianrui6641/tais_coder_mini_36b_a3b_core_generalist-merged-NVFP4

18B • Updated Apr 1 • 1

baseten/Qwen3-4B-NVFP4-PTQ

2B • Updated Apr 1 • 5 • 1

baseten/Qwen3-1.7B-NVFP4-PTQ

1B • Updated Apr 1 • 3

bg-digitalservices/Gemma-4-26B-A4B-it-NVFP4A16

Text Generation • 15B • Updated Apr 5 • 2.45k • 5

bg-digitalservices/Gemma-4-26B-A4B-it-NVFP4

Text Generation • 15B • Updated Apr 5 • 67.8k • 33

anthbacop/Gemma-4-31B-IT-NVFP4

Text Generation • 21B • Updated Apr 3 • 8

bg-digitalservices/Apertus-8B-2509-NVFP4

Text Generation • 5B • Updated Apr 6 • 5

bg-digitalservices/Apertus-8B-2509-NVFP4A16

Text Generation • 5B • Updated Apr 6 • 4

bg-digitalservices/Apertus-8B-Instruct-2509-NVFP4

Text Generation • 5B • Updated Apr 6 • 3 • 1

bg-digitalservices/Apertus-8B-Instruct-2509-NVFP4A16

Text Generation • 5B • Updated Apr 6 • 3

bg-digitalservices/Apertus-70B-2509-NVFP4

Text Generation • 36B • Updated Apr 6 • 68

bg-digitalservices/Apertus-70B-2509-NVFP4A16

Text Generation • 36B • Updated Apr 6 • 4

bg-digitalservices/Apertus-70B-Instruct-2509-NVFP4

Text Generation • 36B • Updated Apr 6 • 40 • 2