Edit Models filters

Model Tree

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

229

Base only

Active filters: sglang

PhalaCloud/GLM-5.2-W4AFP8

Text Generation • 392B • Updated 3 days ago • 33.7k • 37

nvidia/Cosmos3-Nano

16B • Updated 1 day ago • 226k • 290

poolside/Laguna-M.1

Text Generation • 226B • Updated 10 days ago • 3.78k • 114

z-lab/Qwen3.6-35B-A3B-DFlash

Text Generation • 0.4B • Updated 21 days ago • 188k • 261

trymirai/weaver

Other • Updated 1 day ago • 5

modal-labs/Qwen3.6-35B-A3B-DFlash

Text Generation • 0.4B • Updated 23 days ago • 1.79k • 16

z-lab/Qwen3.5-4B-DFlash

Text Generation • 0.6B • Updated 21 days ago • 18.7k • 33

nvidia/Cosmos3-Super

65B • Updated 1 day ago • 60.2k • 195

nvidia/Cosmos3-Super-Text2Image

Text-to-Image • 65B • Updated 1 day ago • 37.7k • 158

z-lab/Qwen3.5-35B-A3B-DFlash

Text Generation • 0.4B • Updated 21 days ago • 5.35k • 41

z-lab/Qwen3.5-122B-A10B-DFlash

Text Generation • 0.8B • Updated 21 days ago • 17.7k • 20

AxionML/Qwen3.5-122B-A10B-NVFP4

Image-Text-to-Text • 62B • Updated Mar 3 • 179 • 7

z-lab/Qwen3.5-9B-DFlash

Text Generation • 1B • Updated 21 days ago • 17.8k • 37

mattbucci/gemma-4-26B-AWQ

26B • Updated May 31 • 18.7k • 1

lmsys/wan22-t2v-a14b-modelopt-fp8-sglang-transformer

Updated Apr 28 • 8 • 2

Zhongzhu/OSCAR-RotationZoo

Text Generation • Updated Jun 8 • 7

nvidia/Cosmos3-Super-Image2Video

Image-to-Video • 65B • Updated 1 day ago • 12.2k • 136

z-lab/Qwen3.5-397B-A17B-DFlash

Text Generation • 1B • Updated 26 days ago • 7.03k • 8

sant1an/GLM-5.2-NVFP4-MTP

Text Generation • Updated 16 days ago • 97 • 2

neko-legends/fish-audio-s2-realtime-optimized-5090

Text-to-Speech • Updated 11 days ago • 1

SurfaceData/llava-v1.6-mistral-7b-sglang

Image-Text-to-Text • 8B • Updated Mar 7, 2024 • 13 • 9

SurfaceData/llava-v1.6-vicuna-7b-sglang

Image-Text-to-Text • 7B • Updated Mar 7, 2024 • 3 • 1

tclf90/qwen2.5-72b-instruct-gptq-int4

Text Generation • 73B • Updated May 12, 2025 • 86 • 2

tclf90/qwen2.5-72b-instruct-gptq-int3

Text Generation • 69B • Updated May 12, 2025 • 156

alvarobartt/grok-2-tokenizer

Updated Aug 27, 2025 • 3

unsloth/grok-2

Text Generation • Updated Sep 6, 2025 • 33 • 5

osmapi/MiniMax-M2-THRIFT

173B • Updated Nov 13, 2025 • 1.16k • 35

mradermacher/MiniMax-M2-THRIFT-GGUF

Updated Apr 28 • 2

JasmineBBB/Kimi-Linear-48B-A3B-Instruct-bnb-4bit

Text Generation • 49B • Updated Nov 5, 2025 • 10 • 1

mradermacher/MiniMax-M2-THRIFT-i1-GGUF

173B • Updated Apr 28 • 143 • 10