Edit Models filters

Model Tree

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

verifiable-rewards

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

8

Base only

Active filters: verifiable-rewards

Shion1124/dapo-dora-qwen-struct

Text Generation • 4B • Updated Feb 8 • 9

MeridianVector/Qwopus3.5-9B-v4

Text Generation • Updated Apr 4

Nalandadata/nalanda-qwen-7b-grpo

Text Generation • 8B • Updated 16 days ago • 44 • 2

dmaheshwar22/qwen-1.5b-coder-grpo-scratch-step200

Text Generation • 2B • Updated Apr 27 • 14

nics-efc/VPR-Minesweeper

Text Generation • 4B • Updated May 12 • 2

nics-efc/VPR-Sudoku

Text Generation • 4B • Updated May 12 • 8

mradermacher/VPR-Minesweeper-GGUF

Reinforcement Learning • 4B • Updated May 12 • 42

nics-efc/VPR-Tic-Tac-Toe

Text Generation • 4B • Updated May 12 • 3