Edit Models filters

Model Tree

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

reinforcement_learning

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

12

Base only

Active filters: reinforcement_learning

Unspoiled-Egg/q-FrozenLake-v1-4x4-nonSlippery

Updated Dec 11, 2024

yqq1231231/emotional_agent

Updated Apr 14, 2025 • 4

yqq1231231/rl-chat-tinyllama

Updated Apr 14, 2025 • 2

SaiResearch/booster_soccer_models

Reinforcement Learning • Updated Feb 2 • 6

jeremyberros/booster_soccer_models

Reinforcement Learning • Updated Oct 10, 2025 • 1

Qiskit/ai-transpiler_linear-functions

Updated Feb 4 • 24 • 4

Qiskit/ai-transpiler_permutations

Updated Feb 4 • 14 • 4

Qiskit/ai-transpiler_cliffords

Updated Feb 4 • 16 • 4

Qiskit/ai-transpiler_paulis

Updated Feb 13 • 22 • 3

Qiskit/ai-transpiler_routing

Updated Mar 6 • 21 • 3

DuruTo/ai-transpiler_linear-functions

Updated Apr 19 • 1 • 1

laion/a2-rl-e2egit_large-50-32B

Text Generation • 33B • Updated May 1 • 5