Edit Models filters

Model Tree

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

11,588

Base only

Active filters: quantized

s-batman/Qwen3.6-27B-NVFP4-MTP-GGUF

Text Generation • 27B • Updated 14 days ago • 1.35k • 6

mudler/Step-3.7-Flash-APEX-GGUF

197B • Updated May 29 • 1.98k • 13

AlicanKiraz0/Titus-CybersecurityLLM-v1.0-Q4_K_M-No-MTP-GGUF

Text Generation • 35B • Updated Jun 1 • 2.81k • 22

SC117/gemma-4-12B-it-heretic-QAT-GGUF

12B • Updated 5 days ago • 49.2k • 34

philipjohnbasile/GLM-5.2-Demolition-q4a4-soul-MLX

Text Generation • 29B • Updated 18 days ago • 6.24k • 7

luoyike2003/LongShu-Qwen3.5-99B-Reap-GameDev-MLX-4bit-FP16

Text Generation • 99B • Updated 22 days ago • 757 • 6

sahilchachra/Qwythos-9B-Claude-Mythos-5-1M-optiq-5bpw-mlx

9B • Updated 16 days ago • 4.03k • 6

sahilchachra/unlimited-ocr-8bit-mlx

Image-Text-to-Text • 1B • Updated 18 days ago • 684 • 4

autotrust/gemma4-31B-Fable-5-Distilled-GGUF

Image-Text-to-Text • 31B • Updated 11 days ago • 2.35k • 9

SceneWorks/krea-2-turbo-mlx

Text-to-Image • Updated 10 days ago • 8

AtomicChat/ornith-35b-GGUF

Text Generation • 35B • Updated 15 days ago • 3.27k • 7

georgeis55/Ornith-1.0-35B-MLX-oQ8

10B • Updated 3 days ago • 8.4k • 2

sakamakismile/Krea-2-Turbo-NVFP4-AWQ

Text-to-Image • Updated 15 days ago • 258 • 5

Jiunsong/SuperQwen-AgentWorld-35B-A3B-abliterated-mlx-4bit

Text Generation • 35B • Updated 15 days ago • 988 • 7

Sebesky/MiniMax-M3-W4A16-GPTQ

Image-Text-to-Text • 430B • Updated 14 days ago • 1.87k • 2

mlx-community/Qwen-AgentWorld-35B-A3B-oQ4

Text Generation • 6B • Updated 13 days ago • 1.42k • 6

mlx-community/Ornith-1.0-35B-3bit

Image-Text-to-Text • 5B • Updated 13 days ago • 852 • 3

canada-quant/GLM-5.2-W4A16-MTP

Text Generation • 116B • Updated 8 days ago • 6.43k • 16

TrNi/efficient-cube3d

Text-to-3D • Updated 5 days ago • 6

Winnougan/Z-Image-Base-Turbo-INT8-Convrot

Text-to-Image • Updated 8 days ago • 15

maci0/Qwopus3.6-27B-Coder-NVFP4

Image-Text-to-Text • 16B • Updated 4 days ago • 44.7k • 2

mudler/Agents-A1-APEX-GGUF

35B • Updated 10 days ago • 20.8k • 12

r0b0tlab/Agents-A1-NVFP4

Text Generation • 19B • Updated 9 days ago • 1.24k • 2

mudler/Qwopus3.6-35B-A3B-Coder-APEX-GGUF

35B • Updated 8 days ago • 7.28k • 2

mlx-community/Laguna-XS-2.1-4bit

Text Generation • 5B • Updated 8 days ago • 337 • 2

blockblockblock/openPangu-2.0-Flash-exl3-4.0bpw

Text Generation • 25B • Updated 7 days ago • 419 • 2

thetom-ai/Nemotron-TheHobbit-30B-A3B

Updated 7 days ago • 122 • 2

OpenMed/privacy-filter-multilingual-v2-mlx-8bit

Token Classification • Updated 8 days ago • 36 • 2

liodon-ai/Ornith-1.0-35B-GGUF-imatrix-GGUF

Text Generation • 35B • Updated 14 minutes ago • 2.03k • 2

liodon-ai/LFM2.5-8B-A1B-imatrix-GGUF

Text Generation • 8B • Updated 6 days ago • 799 • 2