Edit Models filters

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

1,460

Full-text search

Active filters: fp8

medmekk/mini-deepseek-r1

4B • Updated Feb 5, 2025 • 4

medmekk/mini-deepseek-r1-4layers

15B • Updated Feb 5, 2025 • 2

huihui-ai/DeepSeek-R1-bf16

Text Generation • Updated Feb 15, 2025 • 6 • 3

RedHatAI/Qwen2.5-VL-3B-Instruct-FP8-dynamic

Image-Text-to-Text • 4B • Updated Apr 22, 2025 • 10.2k • 3

RedHatAI/Qwen2.5-VL-7B-Instruct-FP8-Dynamic

Image-Text-to-Text • 8B • Updated Apr 3, 2025 • 868 • 5

RedHatAI/Qwen2.5-VL-72B-Instruct-FP8-dynamic

Image-Text-to-Text • 73B • Updated Apr 25, 2025 • 10.4k • 15

medmekk/llama-8b-test

8B • Updated Feb 7, 2025 • 1

amd-quark/llama-tiny-fp8-quant-method

17.1M • Updated Feb 7, 2025 • 4.72k

medmekk/llama-70b-test

71B • Updated Feb 7, 2025

nm-testing/pixtral-12b-FP8-dynamic

Image-Text-to-Text • Updated Apr 11, 2025 • 1.42k • 1

ghostplant/r1-671b-hf

Updated Feb 12, 2025

baseten/r1-nextn-head0

13B • Updated Feb 14, 2025

baseten/v3-nextn-head0

13B • Updated Feb 14, 2025 • 1

SGLang/DeepSeek-V3-NextN

13B • Updated Feb 15, 2025 • 904 • 10

SGLang/DeepSeek-R1-NextN

13B • Updated Feb 15, 2025 • 48 • 10

othsueh/second-repo

Updated Feb 18, 2025 • 2

starsy/Mistral-Small-24B-Instruct-2501-FP8-Dynamic

Text Generation • 24B • Updated Feb 18, 2025 • 25

context-labs/Meta-Llama-3.1-8B-Instruct-FP8

Text Generation • Updated Feb 20, 2025

jhall0310/chat

Text Generation • Updated Aug 15, 2025 • 1

chutesai/DeepSeek-V3-NextN

12B • Updated Mar 26, 2025 • 2

context-labs/neuralmagic-llama-3.1-8b-instruct-FP8

Text Generation • 8B • Updated Feb 23, 2025 • 6

context-labs/neuralmagic-mistral-nemo-12b-instruct-FP8

12B • Updated Feb 23, 2025 • 1

context-labs/neuralmagic-llama-3.1-70b-instruct-FP8

Text Generation • 71B • Updated Feb 24, 2025 • 3

FlagRelease/DeepSeek-R1-FlagOS-Nvidia-BF16

684B • Updated Jul 21, 2025 • 7

FlagRelease/DeepSeek-R1-FlagOS-Metax-BF16

684B • Updated Jul 21, 2025 • 2

thisnick/DeepSeek-R1-Distill-Llama-70B-abliterated-FP8-Dynamic

71B • Updated Feb 24, 2025 • 3

RedHatAI/Mixtral-8x22B-Instruct-v0.1-FP8

141B • Updated Feb 26, 2025 • 679

VarunBudhani/deepseek-r1

Text Generation • Updated Mar 1, 2025 • 2

lmsys/DeepSeek-V3-NextN

12B • Updated Mar 27, 2025 • 2.34k • 1

lmsys/DeepSeek-R1-NextN

12B • Updated Mar 27, 2025 • 4k • 5