Edit Models filters

Model Tree

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

91

Base only

Active filters: emerald

llmware/llama-11b-vision-instruct-ov

Updated Oct 31, 2024 • 8 • 2

llmware/qwen2-vl-2b-instruct-ov

Updated Oct 31, 2024 • 13 • 2

llmware/qwen2-vl-7b-instruct-ov

Updated Oct 31, 2024 • 3 • 1

llmware/llama-3.2-1b-instruct-onnx

Updated Oct 31, 2024 • 10 • 2

llmware/phi-3-vision-onnx

Updated Feb 13, 2025 • 4

llmware/llama-3.2-1b-gguf

1B • Updated Feb 8, 2025 • 34 • 1

llmware/llama3.2-3b-gguf

3B • Updated Feb 8, 2025 • 27

llmware/qwen2.5-7b-coder-gguf

8B • Updated Feb 8, 2025 • 74

llmware/phi-4-ov

Updated Jan 15 • 3

llmware/phi-3.5-onnx-qnn

Updated Feb 14, 2025 • 38 • 2

llmware/deepseek-qwen-14b-gguf

15B • Updated Jul 6, 2025 • 44 • 1

llmware/deepseek-qwen-7b-gguf

8B • Updated Jul 7, 2025 • 36 • 1

llmware/phi-3.5-gguf

4B • Updated Feb 8, 2025 • 19

llmware/qwen2-1.5b-instruct-gguf

2B • Updated Feb 8, 2025 • 5

llmware/qwen-2-0.5b-gguf

0.5B • Updated Feb 8, 2025 • 3

llmware/phi-3-gguf

4B • Updated Feb 14, 2025 • 10

llmware/qwen-2.5-14b-instruct-gguf

15B • Updated Feb 14, 2025 • 22

llmware/gemma-2-9b-instruct-gguf

9B • Updated Feb 14, 2025 • 119 • 1

llmware/llama-3.2-3b-onnx-qnn

Updated Feb 14, 2025 • 15 • 1

llmware/qwen2.5-32b-gguf

33B • Updated Feb 14, 2025 • 8

llmware/mistral-7b-instruct-v0.3-gguf

7B • Updated Feb 14, 2025 • 30

llmware/gemma-2-27b-instruct-gguf

27B • Updated Feb 14, 2025 • 77

llmware/phi-4-mini-gguf

4B • Updated Jul 5, 2025 • 80 • 1

llmware/slim-sentiment-npu-ov

Updated Mar 27, 2025 • 4

llmware/llama-3.2-1b-instruct-npu-ov

Updated Jan 15 • 34 • 1

llmware/llama-3.2-3b-instruct-npu-ov

Updated Mar 27, 2025 • 32

llmware/slim-emotions-npu-ov

Updated Mar 27, 2025 • 3

llmware/slim-extract-tiny-npu-ov

Updated Mar 27, 2025 • 3

llmware/phi-4-npu-ov

Updated Mar 27, 2025 • 13

llmware/slim-topics-npu-ov

Updated Mar 27, 2025 • 4