Edit Models filters

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

467

Full-text search

Active filters: int8

RedHatAI/DeepSeek-R1-Distill-Qwen-32B-quantized.w8a8

Text Generation • Updated Feb 27, 2025 • 121 • 13

RedHatAI/DeepSeek-R1-Distill-Qwen-7B-quantized.w8a8

Text Generation • 8B • Updated Feb 27, 2025 • 6.51k • 5

RedHatAI/DeepSeek-R1-Distill-Qwen-1.5B-quantized.w8a8

Text Generation • 2B • Updated Feb 27, 2025 • 7.88k • 2

RedHatAI/Pixtral-Large-Instruct-2411-hf-quantized.w8a8

Image-Text-to-Text • 124B • Updated Mar 31, 2025 • 1

ospatch/QwQ-32B-INT8-W8A8

Text Generation • 33B • Updated Mar 13, 2025 • 4 • 5

labaispeak/stable-diffusion-2-1-openvino-int8

Text-to-Image • Updated Mar 25, 2025 • 1

ConfidentialMind/gte-multilingual-reranker-base-onnx-op14-opt-gpu-int8

Sentence Similarity • Updated Jul 7, 2025 • 293 • 1

QuantTrio/Qwen3-235B-A22B-GPTQ-Int8

Text Generation • 235B • Updated Sep 5, 2025 • 152

Gapeleon/bytedance_BAGEL-7B-MoT-INT8

Any-to-Any • Updated Aug 2, 2025 • 1 • 24

sfrontull/transloco-ita-lld

Translation • Updated May 27, 2025

mr-abhisharma/AceNemotron-14B-Quantize-8bit

Text Generation • 15B • Updated Jun 2, 2025

DESUCLUB/Llama-3.1-8B-Instruct-quantized.w8a8

Text Generation • Updated Jun 2, 2025 • 9

DESUCLUB/Llama-3.1-8B-Instruct-bf16-quantized.w8a8

Text Generation • Updated Jun 4, 2025

CarlOwOs/Qwen3-0.6B-Base-int8

Text Generation • 0.8B • Updated Jun 5, 2025 • 1

DESUCLUB/Qwen3-14B-v0.2-deepresearch-no-think-100-step-bf16-quantized.w8a8

Text Generation • Updated Jun 10, 2025 • 2

AXERA-TECH/MiniCPM4-0.5B

Text Generation • Updated Nov 28, 2025 • 1 • 1

vlad-m-dev/mobilenetv2_doc_photo_quant

Image Classification • Updated Jun 15, 2025 • 1

vlad-m-dev/mobilenet_v3_small_onnx_photo_doc

Image Classification • Updated Jun 15, 2025 • 2

janni-t/qwen3-embedding-0.6b-int8-tei-onnx

Sentence Similarity • Updated Jun 17, 2025 • 42 • 2

raul-delarosa99/bert-base-multilingual-cased-ner-es-onnx-static-int8

Token Classification • Updated Aug 25, 2025 • 161

vlad-m-dev/distiluse-base-multilingual-v2-merged-onnx

Feature Extraction • Updated Oct 29, 2025 • 1

onnx-community/distiluse-base-multilingual-v2-merged-onnx

Feature Extraction • Updated Jun 26, 2025 • 1

Parveshiiii/mistral-small-int8

Text Generation • 7B • Updated Jul 8, 2025 • 2 • 1

Chris7v7/nllb-200-3.3B-int8

Translation • Updated Jul 22, 2025 • 3

Kernicterus/whisper-large-v3-turbo-ct2-int8

Updated Jul 23, 2025 • 3

AINovice2005/Voxtral-Mini-3B-2507-smashed

Audio-Text-to-Text • Updated Jul 24, 2025

AINovice2005/medgemma-4b-it-smashed

Image-Text-to-Text • 4B • Updated Jul 24, 2025 • 1

groxaxo/Qwen3-8B-abliterated-GPTQ-W8A16

3B • Updated Jul 26, 2025 • 1 • 1

groxaxo/OpenCodeReasoning-Nemotron-1.1-32B-GPTQ-W8A16

Text Generation • Updated Jul 28, 2025 • 1

RedHatAI/gemma-3n-E4B-it-quantized.w8a8

Image-Text-to-Text • 8B • Updated Aug 1, 2025 • 1