Edit Models filters

Model Tree

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

1,824

Base only

Active filters: quantization

Edison2ST/omniASR_CTC_300M_v2_Q4_ONNX

Updated Jan 25 • 1

Edison2ST/Qwen3-1.7B-Q4-ONNX

RyanLucas3/ptq-Qwen-Qwen3-14B-W6A6-lf10-seed1

Text Generation • 15B • Updated Jan 26 • 2

nota-ai/Solar-Open-100B-NotaMoEQuant-Int4

Text Generation • Updated Jan 26 • 215 • 46

nota-ai/Solar-Open-100B-Nota-FP8

Text Generation • Updated Jan 26 • 120 • 31

bcacdwk/slidesparse-checkpoints

ealexeev/TheDrummer-Valkyrie-49B-v2.1-NVFP4

Text Generation • 29B • Updated Mar 7 • 154

RyanLucas3/ptq-meta-llama-Meta-Llama-3-8B-W4A4-lf0.5-seed1-ce

RyanLucas3/ptq-meta-llama-Meta-Llama-3-8B-W4A4-lf1-seed1-ce

RyanLucas3/ptq-meta-llama-Meta-Llama-3-8B-W4A4-lf2-seed1-ce

3ndetz/LTX2-Rapid-Merges-GGUF

Image-Text-to-Video • 19B • Updated Feb 3 • 940 • 24

DexopT/Qwen2.5-Coder-3B-Instruct-abliterated-MNN

Text Generation • Updated Jan 27 • 13

ealexeev/TheDrummer-Skyfall-31B-v4.1-NVFP4

18B • Updated Mar 6 • 49 • 1

ealexeev/TheDrummer-Rocinante-X-12B-v1-NVFP4

Text Generation • 7B • Updated Mar 6 • 8

dtometzki/Qwen3-30B-A3B-awq-sym

Text Generation • 5B • Updated Jan 28 • 261

dtometzki/Qwen3-30B-A3B-MXFP4A16

Text Generation • 17B • Updated Jan 28 • 3

Thorge-AI/llama-guard-3-1b-q8_0.gguf

Text Generation • 1B • Updated Jan 29 • 6 • 1

tzervas/phi-4-bitnet-1.58b

Text Generation • 4B • Updated Jan 29 • 238 • 2

tzervas/qwen2.5-coder-14b-bitnet-1.58b

Text Generation • 4B • Updated Jan 29 • 5.98k • 4

tzervas/qwen2.5-coder-32b-bitnet-1.58b

Text Generation • 9B • Updated Jan 29 • 1.2k • 3

logiya-vidhyapathi/llama_quantization_4_bit

Text Generation • 8B • Updated Jan 30 • 2

Zap11/gemma-3-1b-editorial-analyzer

Text Generation • 1.0B • Updated Jan 29 • 3 • 1

JongYeop/Mistral-7B-Instruct-v0.2-FP8-W8A8

Text Generation • 7B • Updated Jan 30 • 5

JongYeop/Mistral-7B-Instruct-v0.2-FP4-W4A4

Text Generation • 4B • Updated Jan 30 • 3

davezaxh/llama-3.2-exp

Text Generation • 3B • Updated Jan 30

Vishva007/Qwen3-4B-Instruct-2507-W4A16-AutoRound-AWQ

Text Generation • 4B • Updated Feb 1 • 2

Vishva007/Qwen3-4B-Instruct-2507-W4A16-AutoRound

Text Generation • 0.9B • Updated Jan 30 • 1

Vishva007/Qwen3-VL-8B-Instruct-W4A16-AutoRound

Image-Text-to-Text • 2B • Updated Feb 7 • 425

btaskel/ChenkinNoob-XL-V0.2-GGUF

Text-to-Image • 3B • Updated Jan 31 • 17

jjjunho/Qwen3-4B-Instruct-2507-Korean-AWQ

4B • Updated Feb 4 • 1