Edit Models filters

Model Tree

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

speculative-decoding

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

725

Base only

Active filters: speculative-decoding

PiehSoft/Qwen3.6-40B-Deckard-MTP

Text Generation • 39B • Updated 9 days ago • 2.95k • 11

mradermacher/Qwopus3.5-4B-Coder-GGUF

4B • Updated 29 days ago • 1.08k • 1

mlx-community/Qwen3.6-27B-MTP-4bit

Text Generation • 66.4M • Updated 26 days ago • 4.76k • 5

mlx-community/Qwen3.6-35B-A3B-MTP-5bit

Text Generation • 0.2B • Updated 26 days ago • 2.73k • 3

sakamakismile/Huihui-LFM2.5-8B-A1B-abliterated-MTP-NVFP4

Text Generation • 0.4B • Updated 24 days ago • 64 • 2

AngelSlim/Qwen3-8b-dflare

Text Generation • 1B • Updated 23 days ago • 62 • 2

mlx-community/gemma-4-26B-A4B-it-qat-assistant-mxfp8

Text Generation • 0.1B • Updated 22 days ago • 783 • 1

mlx-community/gemma-4-31B-it-qat-assistant-bf16

Text Generation • 0.5B • Updated 22 days ago • 2.08k • 1

mlx-community/gemma-4-31B-it-qat-assistant-mxfp8

Text Generation • 0.1B • Updated 22 days ago • 1.32k • 1

plunderstruck/Qwen3.6-27B-MTP-ROCmFP4-GGUF

0.5B • Updated 6 days ago • 8.57k • 24

sakamakismile/Huihui-gemma-4-31B-it-qat-abliterated-MTP-NVFP4

Image-Text-to-Text • 18B • Updated 15 days ago • 552 • 1

plunderstruck/Qwen3.6-40B-Deckard-MTP-ROCmFP4-GGUF

0.5B • Updated 6 days ago • 12.6k • 6

s-batman/Qwopus3.6-27B-Coder-NVFP4-MTP-GGUF

Image-Text-to-Text • 0.5B • Updated 15 days ago • 10.8k • 1

FINAL-Bench/Darwin-28B-Coder-GGUF

Text Generation • 27B • Updated 11 days ago • 22k • 24

WaveCut/Qwopus3.6-27B-Coder-FP8-W4A16-G64-RTN-vllm

Image-Text-to-Text • 6B • Updated 13 days ago • 611 • 2

jcbtc/chadrock3.6-40b-opus-deckard-uncensored-thinking-neo-code-di-imatrix-rocmfp4

Text Generation • 39B • Updated 4 days ago • 1.35k • 6

VirVen/T-pro-it-2.1-EAGLE_V3

2B • Updated 5 days ago • 173 • 1

sakamakismile/Huihui-Nex-N2-mini-abliterated-MTP-NVFP4

Image-Text-to-Text • 20B • Updated 11 days ago • 402 • 5

Kimuraxhalu/gemma-4-12B-coder-fable5-composer2.5-MTP-NVFP4

Text Generation • 7B • Updated 11 days ago • 58 • 3

modal-labs/Qwen3.5-9B-DFlash

Text Generation • 1B • Updated 11 days ago • 378 • 2

modal-labs/Qwen3.5-27B-DFlash

Text Generation • 2B • Updated 11 days ago • 389 • 1

SixVolts/Qwen3.5-122B-A10B-Opus-Reasoning-MTP-GGUF

122B • Updated 8 days ago • 739 • 1

AlexWortega/North-Mini-Code-1.0-EAGLE3

0.2B • Updated 7 days ago • 34 • 1

philtheriver/Qwopus3.6-27B-v2-MTP-ROCmFPX

Text Generation • 27B • Updated 4 days ago • 389 • 1

claymorecrystal/Qwen3.6-27B-PRISM-PRO-DQ

Text Generation • 27B • Updated 6 days ago • 309 • 1

SC117/QwenPaw-Flash-9B-MTP-GGUF

0.5B • Updated 4 days ago • 1.3k • 1

AEON-7/Qwen3.6-27B-AEON-Ultimate-Uncensored-Multimodal-MLX-FP4

Image-Text-to-Text • 6B • Updated 2 days ago • 1.2k • 1

AEON-7/Qwen3.6-27B-AEON-Ultimate-Uncensored-MLX-MTP-Drafter

0.4B • Updated 4 days ago • 499 • 1

inferencerlabs/GLM-5.2-MTP-MLX-Q4

Image-Text-to-Text • 2B • Updated 2 days ago • 1.08k • 1

jcbtc/Qwable-5-27B-Chadrock-v2-ROCmFP6-QUALITY

Text Generation • 27B • Updated 2 days ago • 225 • 1