Edit Models filters

Model Tree

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

One-click Deployment

Inference Endpoints

Microsoft Foundry

Amazon SageMaker AI

Misc

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

9,207

Base only

Active filters: chat

second-state/QwQ-32B-Preview-GGUF

Text Generation • 33B • Updated Nov 28, 2024 • 50

gaianet/QwQ-32B-Preview-GGUF

Text Generation • 33B • Updated Nov 28, 2024 • 12

QuantFactory/SD-Prompter-1.5B-V0.1-GGUF

2B • Updated Nov 29, 2024 • 267 • 3

unsloth/QwQ-32B-Preview

Text Generation • 33B • Updated Nov 28, 2024 • 10 • 7

shashikanth-a/tinyllama-chat-4bit

Text Generation • 0.2B • Updated Nov 28, 2024 • 7

shashikanth-a/llama-2-7b-chat-4bit

Text Generation • 1B • Updated Nov 28, 2024 • 9

unsloth/QwQ-32B-Preview-bnb-4bit

Text Generation • 34B • Updated Nov 28, 2024 • 128 • 4

unsloth/QwQ-32B-Preview-GGUF

Text Generation • 33B • Updated Nov 28, 2024 • 1.13k • 12

RedHatAI/Qwen2.5-Coder-14B-Instruct-FP8-dynamic

Text Generation • 15B • Updated Sep 23, 2025 • 39.3k • 1

AIR-hl/Llama-3.2-1B-DPO

Text Generation • 1B • Updated Dec 24, 2024 • 10 •

mlx-community/Qwen_QwQ-32B-Preview_MLX-8bit

Text Generation • 9B • Updated Nov 28, 2024 • 35 • 4

tensorblock/ghost-8b-beta-GGUF

Text Generation • 8B • Updated Jan 27 • 116 • 1

mradermacher/Llama-3.2-1B-DPO-GGUF

1B • Updated Nov 28, 2024 • 60

huihui-ai/QwQ-32B-Preview-abliterated

Text Generation • 33B • Updated Nov 28, 2024 • 20 • • 104

mlx-community/Qwen_QwQ-32B-Preview_MLX-4bit

Text Generation • 5B • Updated Nov 28, 2024 • 22 • 1

DrNicefellow/Qwen-QwQ-32B-Preview-4.25bpw-exl2

Text Generation • Updated Nov 28, 2024 • 7 • 3

tensorblock/calme-2.8-qwen2-7b-GGUF

Text Generation • 8B • Updated Jan 27 • 29

MarsupialAI/Monstral-123B-v2

Text Generation • 123B • Updated Jan 14, 2025 • 79 • 48

async0x42/QwQ-32B-Preview-exl2_3.5bpw

Text Generation • Updated Nov 29, 2024 • 4

tensorblock/magnum-v2-12b-GGUF

Text Generation • 12B • Updated Jan 27 • 19

async0x42/QwQ-32B-Preview-exl2_4.5bpw

Text Generation • Updated Nov 29, 2024 • 5 • 1

deltanym/QwQ-32B-Preview-abliterated-Q5_K_M-GGUF

Text Generation • 33B • Updated Nov 28, 2024 • 3

waltervix/QwQ-32B-Preview-Q2_K-GGUF

Text Generation • 33B • Updated Nov 29, 2024 • 41

deltanym/QwQ-32B-Preview-abliterated-Q4_K_M-GGUF

Text Generation • 33B • Updated Nov 29, 2024 • 18 • 2

Hack337/QwQ-32B-Preview-abliterated-Q3_K_S-GGUF

Text Generation • 33B • Updated Nov 29, 2024 • 18 • 2

async0x42/QwQ-32B-Preview-exl2_5.0bpw

Text Generation • Updated Nov 29, 2024 • 4

DavidAU/L3.1-Instruct-Guru-8B-GGUF

Text Generation • 8B • Updated May 28, 2025 • 142 • 4

huihui-ai/QwQ-32B-Coder-Fusion-9010

Text Generation • 33B • Updated Dec 12, 2024 • 34 • • 12

lmstudio-community/QwQ-32B-Preview-MLX-4bit

Text Generation • 5B • Updated Nov 29, 2024 • 7

lmstudio-community/QwQ-32B-Preview-MLX-8bit

Text Generation • 9B • Updated Nov 29, 2024 • 6