Edit Models filters

Model Tree

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

1,914

Base only

Active filters: nvidia

nvidia/Cosmos3-Super-Text2Image

Text-to-Image • 65B • Updated 23 days ago • 58.8k • 158

nvidia/diffusiongemma-26B-A4B-it-NVFP4

Text Generation • 14B • Updated 4 days ago • 1.69M • 95

nvidia/Cosmos-Predict2-2B-Text2Image

Text-to-Image • Updated Jun 17, 2025 • 589 • 89

nvidia/NVIDIA-Nemotron-3-Super-120B-A12B-FP8

Text Generation • 124B • Updated Apr 29 • 250k • 265

unsloth/NVIDIA-Nemotron-3-Nano-4B-GGUF

Text Generation • 4B • Updated Mar 17 • 6.74k • 78

nvidia/Nemotron-Cascade-2-30B-A3B

Text Generation • 32B • Updated May 1 • 90.5k • 509

empero-ai/openNemo-9B

Text Generation • 9B • Updated Mar 23 • 475 • 11

nvidia/Kimodo-SOMA-RP-v1.1

0.3B • Updated Apr 10 • 2.79k • 30

nvidia/Nemotron-Labs-Diffusion-14B

Text Generation • 14B • Updated Jun 3 • 10.5k • 150

cHunter789/Qwen3.6-27B-i1-IQ4_KS-GGUF

Text Generation • 27B • Updated 15 days ago • 7.49k • 25

nvidia/Cosmos3-Super-Image2Video

Image-to-Video • 65B • Updated 23 days ago • 32.7k • 136

unsloth/NVIDIA-Nemotron-3-Ultra-550B-A55B-GGUF

Text Generation • 549B • Updated Jun 4 • 15.2k • 32

nvidia/Qwen3.5-397B-A17B-NVFP4-V2

Text Generation • Updated 9 days ago • 19.3k • 5

nvidia/Kimi-K2.7-Code-NVFP4

Text Generation • Updated 2 days ago • 3

nvidia/Cosmos-1.0-Guardrail

Updated Jun 11, 2025 • 13.8k • 67

nvidia/Llama-3_3-Nemotron-Super-49B-v1

Text Generation • 50B • Updated Oct 15, 2025 • 189k • 324

nvidia/Cosmos-Predict2-2B-Video2World

Image-to-Video • Updated Jul 23, 2025 • 70.8k • 72

nvidia/Cosmos-Reason2-2B

Image-Text-to-Text • 2B • Updated Apr 30 • 664k • 115

nvidia/Nemotron-Labs-Diffusion-3B

Text Generation • 4B • Updated Jun 3 • 135k • 37

nvidia/NVIDIA-Nemotron-3-Nano-4B-BF16

Text Generation • 4B • Updated Mar 20 • 1.57M • 101

cyankiwi/NVIDIA-Nemotron-3-Super-120B-A12B-AWQ-4bit

Text Generation • 127B • Updated Mar 23 • 36.2k • 9

nvidia/MiniMax-M2.7-NVFP4

Text Generation • 116B • Updated Apr 24 • 103k • 63

unsloth/NVIDIA-Nemotron-3-Nano-Omni-30B-A3B-Reasoning-GGUF

Text Generation • 32B • Updated Apr 28 • 13.8k • 134

mlx-community/Nemotron-Labs-Diffusion-3B-4bit

Text Generation • 0.6B • Updated 12 days ago • 903 • 4

Singla0009/Parakeet-TDT-0.6B-Multilingual-GGUF

Automatic Speech Recognition • 0.6B • Updated 12 days ago • 224 • 2

nvidia/OpenMath-CodeLlama-70b-Python-hf

Text Generation • 69B • Updated Feb 16, 2024 • 61 • 13

nvidia/Nemotron-4-340B-Base

Updated Jun 28, 2024 • 178 • 150

nvidia/Minitron-8B-Base

Text Generation • Updated Feb 14, 2025 • 39.5k • 71

nvidia/Llama-3.1-Nemotron-70B-Instruct-HF

Text Generation • 71B • Updated Apr 13, 2025 • 37.6k • • 2.07k

nvidia/Cosmos-Transfer1-7B

Updated Nov 19, 2025 • 1.71k • 66