Edit Models filters

Model Tree

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

One-click Deployment

Inference Endpoints

Microsoft Foundry

Amazon SageMaker AI

Misc

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

9,211

Base only

Active filters: chat

bullerwins/QwQ-32B-Preview-exl2_4.0bpw

Text Generation • Updated Dec 2, 2024 • 6

bullerwins/QwQ-32B-Preview-exl2_5.0bpw

Text Generation • Updated Dec 2, 2024 • 4

bullerwins/QwQ-32B-Preview-exl2_6.0bpw

Text Generation • Updated Dec 2, 2024 • 4

bullerwins/QwQ-32B-Preview-exl2_8.0bpw

Text Generation • Updated Dec 2, 2024 • 3

mradermacher/QwQ-32B-Coder-Fusion-7030-i1-GGUF

33B • Updated Dec 4, 2024 • 67 • 1

roxy45/QwQ-32B-Preview-Q4_K_M-GGUF

33B • Updated Dec 2, 2024 • 2

mradermacher/Holland-4B-V1-i1-GGUF

5B • Updated Apr 22, 2025 • 72

mradermacher/Darkens-8B-GGUF

8B • Updated Dec 3, 2024 • 73 • 2

mradermacher/Baldur-8B-GGUF

8B • Updated Dec 3, 2024 • 433

mradermacher/Tor-8B-GGUF

8B • Updated Dec 3, 2024 • 44

mradermacher/Baldur-8B-i1-GGUF

8B • Updated Dec 3, 2024 • 458

mradermacher/Darkens-8B-i1-GGUF

8B • Updated Dec 3, 2024 • 700 • 2

mradermacher/Tor-8B-i1-GGUF

8B • Updated Dec 3, 2024 • 98

tensorblock/calme-3.2-instruct-3b-GGUF

Text Generation • 3B • Updated Jan 27 • 7

Dracones/QwQ-32B-Preview_exl2_8.0bpw

Text Generation • Updated Dec 3, 2024 • 4

Dracones/QwQ-32B-Preview_exl2_7.0bpw

Text Generation • Updated Dec 3, 2024 • 4

Dracones/QwQ-32B-Preview_exl2_6.0bpw

Text Generation • Updated Dec 3, 2024 • 5 • 1

Dracones/QwQ-32B-Preview_exl2_5.0bpw

Text Generation • Updated Dec 3, 2024 • 4

Dracones/QwQ-32B-Preview_exl2_4.5bpw

Text Generation • Updated Dec 3, 2024 • 3

Dracones/QwQ-32B-Preview_exl2_4.0bpw

Text Generation • Updated Dec 3, 2024 • 3

tensorblock/calme-3.2-baguette-3b-GGUF

Text Generation • 3B • Updated Jan 27 • 12

sail/Sailor2-8B-Chat

Text Generation • 9B • Updated Feb 20, 2025 • 681 • 19

sail/Sailor2-20B-Chat-1203

Text Generation • 19B • Updated Feb 20, 2025 • 19 • 24

sail/Sailor2-1B-Chat

Text Generation • 1.0B • Updated Feb 20, 2025 • 642 • 16

bullerwins/QwQ-32B-Preview-exl2_4.5bpw

Text Generation • Updated Apr 28, 2025 • 4

bullerwins/QwQ-32B-Preview-exl2_5.5bpw

Text Generation • Updated Apr 28, 2025 • 4

Apel-sin/qwq-32b-coder-fusion-8020-exl2

Text Generation • Updated Dec 3, 2024

tensorblock/calme-3.3-instruct-3b-GGUF

Text Generation • 3B • Updated Jan 27 • 33

RedHatAI/Qwen2.5-14B-quantized.w8a8

Text Generation • 15B • Updated Dec 3, 2024 • 23 • 2

MarsupialAI/Monstral-123B-v2_GGUF

Text Generation • 123B • Updated Dec 4, 2024 • 128 • 3