Edit Models filters

Model Tree

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

19

Base only

Active filters: RLinf

RLinf/RLinf-math-1.5B

Reinforcement Learning • 2B • Updated Sep 1, 2025 • 19 • 1

RLinf/RLinf-math-7B

Text Generation • 8B • Updated Oct 10, 2025 • 11 • 3

mradermacher/RLinf-math-1.5B-GGUF

2B • Updated Aug 27, 2025 • 26

mradermacher/RLinf-math-7B-GGUF

Reinforcement Learning • 8B • Updated Oct 11, 2025 • 22 • 1

mradermacher/RLinf-math-1.5B-i1-GGUF

2B • Updated Dec 23, 2025 • 161

mradermacher/RLinf-math-7B-i1-GGUF

Reinforcement Learning • 8B • Updated Dec 23, 2025 • 45 • 1

RLinf/RLinf-OpenVLAOFT-GRPO-LIBERO-object

Reinforcement Learning • 8B • Updated Dec 21, 2025 • 24

RLinf/RLinf-OpenVLA-GRPO-ManiSkill3-25ood

Reinforcement Learning • 8B • Updated Oct 10, 2025 • 16

RLinf/RLinf-OpenVLAOFT-GRPO-ManiSkill3-25ood

Reinforcement Learning • 8B • Updated Oct 10, 2025 • 13

RLinf/RLinf-OpenVLAOFT-GRPO-LIBERO-goal

Reinforcement Learning • 8B • Updated Dec 21, 2025 • 7

RLinf/RLinf-OpenVLAOFT-GRPO-LIBERO-spatial

Reinforcement Learning • 8B • Updated Dec 21, 2025 • 86

RLinf/RLinf-OpenVLAOFT-GRPO-LIBERO-long

Reinforcement Learning • 8B • Updated Dec 21, 2025 • 21

RLinf/RLinf-OpenVLA-PPO-ManiSkill3-25ood

Reinforcement Learning • 8B • Updated Oct 10, 2025 • 5

RLinf/RLinf-OpenVLAOFT-PPO-ManiSkill3-25ood

Reinforcement Learning • 8B • Updated Oct 10, 2025 • 31

RLinf/RLinf-OpenVLAOFT-ManiSkill-Base-Lora

Reinforcement Learning • Updated Dec 14, 2025

RLinf/RLinf-OpenVLAOFT-GRPO-LIBERO-90

Reinforcement Learning • 8B • Updated Dec 21, 2025 • 79

RLinf/RLinf-OpenVLAOFT-LIBERO-130-Base-Lora

Reinforcement Learning • 8B • Updated Dec 21, 2025 • 2.1k

RLinf/RLinf-OpenVLAOFT-LIBERO-130

Reinforcement Learning • 8B • Updated Dec 21, 2025 • 228 • 3

RLinf/RLinf-OpenVLAOFT-LIBERO-90-Base-Lora

Reinforcement Learning • 8B • Updated Dec 21, 2025 • 44