Edit Models filters

Model Tree

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

preference-optimization

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

74

Base only

Active filters: preference-optimization

tokutsu/japanese-answer-13b-8bit

Updated Apr 21, 2025 • 4

HaiZhiYan/CheX-Phi35V

Visual Question Answering • Updated Dec 8, 2025 • 2

tahamajs/llama-3.2-3b-orpo-lora64-4bit-instruct

Updated Apr 3, 2025 • 3

Likhith003/dpo-pairrm-lora-adapter

Text Generation • 1B • Updated Apr 19, 2025 • 28 •

Likhith003/dpo-llmjudge-lora-adapter

Text Generation • 1B • Updated Apr 19, 2025 • 31 •

jasperyeoh2/mistral-dpo-peft

Updated Apr 25, 2025 • 2

loganlin777/mistral-7b-dpo-adapter

Updated Apr 27, 2025

gandhiraketla277/finance-llama-3.1-8b-dpo-trained

Text Generation • Updated Aug 24, 2025 • 2

ecoxial2007/CheX-Phi4MM-GRPO

Image-Text-to-Text • 6B • Updated Dec 24, 2025 • 5 • 1

vidavox/Qwen3-SKK-32B-DPO

Text Generation • Updated Dec 11, 2025

Nishef/MiniCPM-1B-sft-bf16-Full_KTO_20251225_185339

Text Generation • Updated Jan 8

Nishef/Qwen3-0.6B-Full_DPO_20251225_130318

Text Generation • Updated Jan 8

Nishef/Qwen3-0.6B-Full_ENHANCED_KTO_20251225_162818

Text Generation • Updated Jan 8

Nishef/Qwen3-0.6B-Full_KTO_20251225_102050

Text Generation • Updated Jan 8

Nishef/Qwen3-0.6B-Full_ORPO_20251225_145426

Text Generation • Updated Jan 8

Nishef/SmolLM2-360M-Full_DPO_20251225_043457

Text Generation • Updated Jan 8

Nishef/SmolLM2-360M-Full_ENHANCED_KTO_20251225_074953

Text Generation • Updated Jan 8

Nishef/SmolLM2-360M-Full_KTO_20251225_020028

Text Generation • Updated Jan 8

Nishef/SmolLM2-360M-Full_ORPO_20251225_062447

Text Generation • Updated Jan 8

Nishef/SmolLM2-360M-Full_ENHANCED_KTO_20251225_074953-merged

Text Generation • 0.4B • Updated Jan 8 • 2

Nishef/Qwen3-0.6B-Full_ENHANCED_KTO_20251225_162818-merged

Text Generation • 0.6B • Updated Jan 8 • 5 • 1

Nishef/SmolLM2-360M-Full_KTO_20251225_020028-merged

Text Generation • 0.4B • Updated Jan 8 • 3

Nishef/SmolLM2-360M-Full_DPO_20251225_043457-merged

Text Generation • 0.4B • Updated Jan 8 • 3

Nishef/SmolLM2-360M-Full_ORPO_20251225_062447-merged

Text Generation • 0.4B • Updated Jan 8 • 3

Nishef/Qwen3-0.6B-Full_KTO_20251225_102050-merged

Text Generation • 0.6B • Updated Jan 8 • 3

Nishef/Qwen3-0.6B-Full_DPO_20251225_130318-merged

Text Generation • 0.6B • Updated Jan 8 • 3

Nishef/Qwen3-0.6B-Full_ORPO_20251225_145426-merged

Text Generation • 0.6B • Updated Jan 8 • 6

Nishef/MiniCPM-1B-sft-bf16-Full_KTO_20251225_185339-merged

Text Generation • 1B • Updated Jan 8 • 2

Nishef/SmolLM2-360M-Full_KNOWLEDGE_RETAINING_ENHANCED_KTO_20251227_151509

Text Generation • Updated Dec 27, 2025 • 4

Nishef/SmolLM2-360M-Full_KNOWLEDGE_RETAINING_ENHANCED_KTO_20251227_151509-merged

Text Generation • 0.4B • Updated Dec 27, 2025 • 4