Edit Models filters

Model Tree

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

custom-implementation

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

28,603

Base only

Active filters: custom-implementation

dicquiloan/q-FrozenLake-v1-8x8-noSlippery

Reinforcement Learning • Updated Nov 26, 2022

BeeBeaver/q-Taxi-v3

Reinforcement Learning • Updated Nov 27, 2022

bsmith0430/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Dec 19, 2022

bsmith0430/q-Taxi-v3

Reinforcement Learning • Updated Dec 19, 2022

sayby/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Dec 26, 2022

sayby/q-Taxi-v3

Reinforcement Learning • Updated Nov 29, 2022

SweepCake/Cartpole_REINFORCE

Reinforcement Learning • Updated Nov 30, 2022

Leo446673/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Nov 30, 2022

Leo446673/q-Taxi-v3

Reinforcement Learning • Updated Nov 30, 2022

michal-lukomski/Reinforce-01

Reinforcement Learning • Updated Dec 2, 2022

sayby/Reinforce-CartPole-v1

Reinforcement Learning • Updated Dec 2, 2022

michal-lukomski/Reinforce-02

Reinforcement Learning • Updated Dec 2, 2022

motmono/diy-ppo-CartPole-v1

Reinforcement Learning • Updated Dec 2, 2022

sayby/Reinforce-pixelcopter

Reinforcement Learning • Updated Dec 3, 2022

Oleg78/molot

Reinforcement Learning • Updated Dec 3, 2022

Oleg78/PixelCopter

Reinforcement Learning • Updated Dec 3, 2022

sayby/Reinforce-Pong-PLE-v0

Reinforcement Learning • Updated Dec 3, 2022

TUMxudashuai/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Dec 4, 2022

TUMxudashuai/q-Taxi-v3

Reinforcement Learning • Updated Dec 4, 2022

lsaulier/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 1, 2023

sayby/PPO-LunarLanderv2

Reinforcement Learning • Updated Dec 6, 2022

juanmi1234/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 28, 2023 • 4

gstaff/ppo-LunarLander-v2

Reinforcement Learning • Updated Feb 28, 2023 • 10

jmsalvi/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Dec 8, 2022

jmsalvi/q-FrozenLake-v1-8x8-Slippery

Reinforcement Learning • Updated Dec 8, 2022

Horenskyih/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Dec 8, 2022

jmsalvi/q-Taxi-v3

Reinforcement Learning • Updated Dec 8, 2022

jmsalvi/q-FrozenLake-v1-8x8

Reinforcement Learning • Updated Dec 8, 2022

Horenskyih/q-Taxi-v3

Reinforcement Learning • Updated Dec 8, 2022

Loriiis/PPO-LunarLander-v2

Reinforcement Learning • Updated Nov 1, 2023 • 4