Edit Models filters

Model Tree

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

13

Base only

Active filters: metalrt

runanywhere/qwen3_0.6B_MLX_4bit

Updated Mar 12 • 1

runanywhere/qwen3_4B_mlx_4bit

Updated Mar 12 • 3

runanywhere/Llama_32_3B_4bit

Updated Mar 12 • 7

runanywhere/whisper_small_4bit

Updated Mar 12 • 17

runanywhere/whisper_medium_4bit

Updated Mar 12 • 33

runanywhere/kokoro_bf16

Updated Mar 12 • 8

runanywhere/metalrt-ios

kcvmk/qwen3_0.6B_MLX_4bit

Updated Mar 23 • 3

kcvmk/qwen3_4B_mlx_4bit

Updated Mar 23 • 3

kcvmk/Llama_32_3B_4bit

Updated Mar 23 • 4

kcvmk/whisper_small_4bit

Updated Mar 23 • 2

kcvmk/whisper_medium_4bit

Updated Mar 23 • 5

kcvmk/kokoro_bf16

Updated Mar 23 • 6