Edit Models filters

Model Tree

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

17

Base only

Active filters: vllm_ci

amd/Llama-3.1-8B-Instruct-FP8-KV

8B • Updated 15 days ago • 108k • 6

amd/Mixtral-8x7B-Instruct-v0.1-FP8-KV

3B • Updated 15 days ago • 14.7k • 3

amd/Llama-2-70b-chat-hf_FP8_MLPerf_V2

69B • Updated 15 days ago • 2.61k

amd/Llama-3.1-8B-Instruct-FP8-KV-Quark-test

8B • Updated 15 days ago • 23.3k

amd/Llama-3.1-8B-Instruct-w-int8-a-int8-sym-test

8B • Updated 15 days ago • 14.2k

amd/Llama-3.3-70B-Instruct-MXFP4-Preview

38B • Updated 15 days ago • 4.83k • 2

amd/PARD-Llama-3.2-1B

Text Generation • 1B • Updated 15 days ago • 34.9k • • 2

amd/PARD-Qwen3-0.6B

Text Generation • 0.8B • Updated 15 days ago • 7.09k • • 2

mradermacher/PARD-Llama-3.2-1B-GGUF

1B • Updated 12 days ago • 184

amd/Qwen3-8B-WMXFP4FP8-AMXFP4FP8-AMP-KVFP8

6B • Updated 15 days ago • 2.93k • 2

amd/Qwen2.5-1.5B-Instruct-ptpc-Quark-ts

2B • Updated 15 days ago • 13.9k

amd/gpt-oss-20b-MoE-Quant-W-MXFP4-A-FP8-KV-FP8

11B • Updated 15 days ago • 9.43k • 2

amd/gpt-oss-20b-WFP8-AFP8-KVFP8

21B • Updated 15 days ago • 10.2k

amd/Qwen3.5-35B-A3B-MXFP4

Image-Text-to-Text • 21B • Updated 15 days ago • 3.85k • 3

amd/gpt-oss-20b-w-mxfp4-a-bf16

12B • Updated 15 days ago • 837

mradermacher/PARD-Qwen3-0.6B-GGUF

0.8B • Updated 15 days ago • 392

mradermacher/PARD-Qwen3-0.6B-i1-GGUF

0.8B • Updated 15 days ago • 633