Edit Models filters

Model Tree

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

5,338

Base only

Active filters: llama.cpp

NicolasSaba/cerebro-v2-GGUF

8B • Updated Mar 16 • 8

mirshadkotta/flutter-expert-llama3-gguf

0.4B • Updated Mar 16 • 72

NicolasSaba/Clone_Nicolas_V2

8B • Updated Mar 16 • 30

hienbm/gemma-3-4b-mtaste-gguf

4B • Updated Mar 16 • 24

jaidhev/SQL_ENG_2

4B • Updated Mar 16 • 20

alirizaercan/qwen2.5-0.5b-lunarlander-action-gguf

Text Generation • 0.5B • Updated Mar 17 • 12

khazarai/Qwen3-4B-Kimi2.5-Reasoning-Distilled-GGUF

Text Generation • 4B • Updated Apr 19 • 3.97k • 9

TirGun/Qwen3.5-4B-GGUF

Text Generation • 4B • Updated Mar 17 • 804

AlSamCur123/Mistral-Nemo-Base-2407-Uncensored

12B • Updated Mar 16 • 424

ConnorRRC/Llama-3.1-8B-Instruct-V1-Model-4bit-GGUF

8B • Updated Mar 16 • 20

NrengifoBTS/Redactor_Llama_v1

8B • Updated Mar 16 • 4

TirGun/Qwen3-VL-4B-Thinking-GGUF

Image-to-Text • 4B • Updated Mar 17 • 215

devray11/Aevis-Medical-SLM

8B • Updated Mar 25 • 15

NrengifoBTS/Redactor_Llama_v2

8B • Updated Mar 16 • 2

NrengifoBTS/Redactor_Llama_v3

8B • Updated Mar 17 • 11

veceloe/zxc3.5-0.8b

0.8B • Updated Mar 17 • 3

bjivanovich/Qwen3.5-4B-Vision-GGUF

4B • Updated Mar 17 • 1.16k • 4

Melaraby/qwen_2b_vlm_gguf

2B • Updated Mar 17 • 53

bjivanovich/Qwen3.5-2B-Vision-GGUF

2B • Updated Mar 17 • 123

chhatramani/nyayalm_civilv1

4B • Updated Mar 17 • 4

Abiray/Sutra-Instruct-350M-GGUF

Text Generation • 0.4B • Updated Mar 17 • 35 • 2

YUGOROU/TeenEmo-LFM2.5-1.2B-GGUF

1B • Updated Mar 17 • 31

srikar-v05/Commit-Message-Draft-LLM-GGUF

4B • Updated Mar 17 • 134

hienbm/qwen3-4b-mtaste-gguf

4B • Updated Mar 17 • 8

harshalmore31/adlerian-philosopher-gguf

15B • Updated Mar 17 • 82 • 1

GabrieleGara/Meta-Llama-3.1-8B-q4_k_m-paul-graham-guide-GGUF

8B • Updated Mar 17 • 24

msibd/phi3.5-finetuned-q4

4B • Updated Mar 17 • 1

Iancheung2288/qwen-emotional-coach-v1-gguf

2B • Updated Mar 17 • 34

osvillal/oscarbot-gguf

3B • Updated Mar 17

SakaiSec/Qwen3.5-0.8B-Multilingual-Thinking-GGUF

0.8B • Updated Mar 17 • 106