Edit Models filters

Model Tree

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

One-click Deployment

Inference Endpoints

Microsoft Foundry

Amazon SageMaker AI

Misc

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

9,211

Base only

Active filters: chat

MaziyarPanahi/calme-3.2-instruct-78b

Text Generation • 78B • Updated Jan 20, 2025 • 712 • 222

unsloth/phi-4-GGUF

Text Generation • 15B • Updated Jan 13, 2025 • 5.91k • 191

Qwen/Qwen2.5-7B-Instruct-1M

Text Generation • 8B • Updated Jan 29, 2025 • 68.5k • • 375

microsoft/bitnet-b1.58-2B-4T-gguf

Text Generation • 2B • Updated Dec 17, 2025 • 31.2k • 292

huihui-ai/BaronLLM_Offensive_Security-abliterated-GGUF

Text Generation • 8B • Updated Jun 11, 2025 • 413 • 52

tachyphylaxis/Huihui-Qwen3-Coder-480B-A35B-Instruct-abliterated-GGUF

Text Generation • 480B • Updated Aug 11, 2025 • 95 • 2

NousResearch/Hermes-4.3-36B

Text Generation • 36B • Updated Dec 6, 2025 • 14.4k • 278

NousResearch/Hermes-4.3-36B-GGUF

Text Generation • 36B • Updated Dec 3, 2025 • 12.9k • 72

baichuan-inc/Baichuan-M3-235B

Text Generation • 235B • Updated Feb 9 • 730 • 99

SupraLabs/supra-title-50M-pre-gguf

Text Generation • 51.8M • Updated Jun 20 • 523 • 20

exnivo/tinybrain-100m-instruct

Text Generation • 0.1B • Updated 26 days ago • 516 • 2

Altworld/Astrea-R8-Chat-9B

Image-Text-to-Text • 9B • Updated 11 days ago • 950 • • 5

NousResearch/Hermes-3-Llama-3.1-8B

Text Generation • 8B • Updated Sep 8, 2024 • 546k • • 475

mradermacher/calme-2.4-rys-78b-GGUF

78B • Updated Sep 16, 2024 • 276 • 8

Qwen/Qwen2.5-7B-Instruct-AWQ

Text Generation • 8B • Updated Oct 9, 2024 • 4.64M • 49

Qwen/Qwen2.5-14B-Instruct-GGUF

Text Generation • 15B • Updated Sep 20, 2024 • 33.3k • 63

Qwen/Qwen2.5-72B-Instruct-GGUF

Text Generation • 73B • Updated Sep 20, 2024 • 3.13k • 46

Qwen/Qwen2.5-3B-Instruct

Text Generation • 3B • Updated Sep 25, 2024 • 5.75M • • 544

Qwen/Qwen2.5-1.5B-Instruct

Text Generation • 2B • Updated Sep 25, 2024 • 14.1M • • 786

bartowski/Qwen2.5-14B-Instruct-GGUF

Text Generation • 15B • Updated Nov 8, 2024 • 93.8k • 69

bartowski/Qwen2.5-1.5B-Instruct-GGUF

Text Generation • 2B • Updated Sep 19, 2024 • 24.5k • 16

Qwen/Qwen2.5-Coder-1.5B-Instruct-GGUF

Text Generation • 2B • Updated Nov 12, 2024 • 72.1k • 79

paultimothymooney/Qwen2.5-7B-Instruct-Q4_K_M-GGUF

Text Generation • 8B • Updated Sep 18, 2024 • 6.78k • 5

bartowski/Qwen2.5-Coder-1.5B-Instruct-GGUF

Text Generation • 2B • Updated Sep 19, 2024 • 9.12k • 15

mradermacher/Qwen2.5-7B-Instruct-i1-GGUF

8B • Updated Oct 11, 2024 • 1.98k • 2

anthracite-org/magnum-v4-12b

Text Generation • 12B • Updated Nov 25, 2024 • 1.12k • • 54

Qwen/Qwen2.5-Coder-32B-Instruct

Text Generation • 33B • Updated Jan 12, 2025 • 1.2M • • 2.09k

lmstudio-community/Qwen2.5-Coder-32B-Instruct-GGUF

Text Generation • 33B • Updated Nov 11, 2024 • 5.97k • 6

bartowski/Qwen2.5-Coder-14B-Instruct-GGUF

Text Generation • 15B • Updated Nov 9, 2024 • 75.8k • 56

bartowski/Qwen2.5-Coder-3B-Instruct-GGUF

Text Generation • 3B • Updated Nov 9, 2024 • 12.5k • 30