Inference Providers
Active filters: sglang
Ex0bit/Qwen3.6-27B-PRISM-EAGLE3
Text Generation
• Updated • 5
Zhongzhu/OSCAR-RotationZoo
Text Generation
• Updated • 3
Image-Text-to-Text
• 7B • Updated • 596k
• 16
scottgl/MiniMax-M2.7-REAP-172B-A10B-NVFP4-GB10
Text Generation
• Updated • 24.7k
• 3
0xSero/GLM-5.1-478B-A42B-REAP-NVFP4
Text Generation
• 280B • Updated • 3.28k
• 10
festr2/MiMo-V2.5-Pro-NVFP4-MXFP8-attn-TP8
Updated • 76
• 1
SurfaceData/llava-v1.6-mistral-7b-sglang
Image-Text-to-Text
• 8B • Updated • 18
• 9
SurfaceData/llava-v1.6-vicuna-7b-sglang
Image-Text-to-Text
• 7B • Updated • 27
• 1
tclf90/qwen2.5-72b-instruct-gptq-int4
Text Generation
• 73B • Updated • 57
• 2
tclf90/qwen2.5-72b-instruct-gptq-int3
Text Generation
• 69B • Updated • 59
alvarobartt/grok-2-tokenizer
Text Generation
• Updated • 95
• 5
173B • Updated • 1.64k
• 35
mradermacher/MiniMax-M2-THRIFT-GGUF
JasmineBBB/Kimi-Linear-48B-A3B-Instruct-bnb-4bit
Text Generation
• 49B • Updated • 9
• 1
mradermacher/MiniMax-M2-THRIFT-i1-GGUF
173B • Updated • 449
• 10
bartowski/VibeStudio_MiniMax-M2-THRIFT-GGUF
Text Generation
• 173B • Updated • 350
• 8
osmapi/MiniMax-M2-THRIFT-55
106B • Updated • 175
• 5
JinnP/SGLang-EAGLE3-Qwen3-Coder-30B-A3B-Instruct
Text Generation
• 0.2B • Updated • 14
• 2
mradermacher/MiniMax-M2-THRIFT-55-GGUF
106B • Updated • 64
• 2
mradermacher/MiniMax-M2-THRIFT-55-i1-GGUF
106B • Updated • 438
• 2
osmapi/MiniMax-M2-THRIFT-55-MLX-4bit
106B • Updated • 22
• 2
osmapi/MiniMax-M2-THRIFT-55-MLX-6bit
106B • Updated • 22
Doradus-AI/MiroThinker-v1.0-30B-FP8
Text Generation
• 31B • Updated • 11
• 4
Doradus-AI/Hermes-4.3-36B-FP8
Text Generation
• 36B • Updated • 361
• 3
Doradus-AI/RnJ-1-Instruct-FP8
Text Generation
• 9B • Updated • 416k
• 4
Image-Text-to-Text
• 841B • Updated • 386
• 3
bullpoint/Qwen3-Coder-Next-AWQ-4bit
Text Generation
• 14B • Updated • 18.1k
• 25
QuantTrio/Qwen3-Coder-Next-E336
Text Generation
• 53B • Updated • 2
• 2
QuantTrio/Qwen3-Coder-Next-E400
Text Generation
• 63B • Updated • 7
• 2