Edit Models filters

Model Tree

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

One-click Deployment

Inference Endpoints

Microsoft Foundry

Amazon SageMaker AI

Misc

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

8,589

Base only

Active filters: deep-rl-class

kenzo4433/Reinforce-Pixelcopter-PLE-v0

Reinforcement Learning • Updated Mar 29, 2023

stelladk/Reinforce-PixelCopter-PLE-v0

Reinforcement Learning • Updated Apr 19, 2023

JamesEJarvis/Reinforce-CartPole-v1

Reinforcement Learning • Updated Mar 29, 2023

mobiusmatt/Reinforce-CartPole-v1initial

Reinforcement Learning • Updated Mar 29, 2023

JamesEJarvis/Reinforce-Pixelcopter-PLE-v0

Reinforcement Learning • Updated Mar 30, 2023

adavies25/Reinforce-Cartpole-1

Reinforcement Learning • Updated Mar 29, 2023

mobiusmatt/Reinforce-Pixelcopter-PLE-v0initial

Reinforcement Learning • Updated Mar 29, 2023

sofiapecora/Reinforce-cartpole2

Reinforcement Learning • Updated Mar 29, 2023

gf2rl/david1

Reinforcement Learning • Updated Mar 29, 2023

gf2rl/david2

Reinforcement Learning • Updated Mar 29, 2023

gf2rl/david3

Reinforcement Learning • Updated Mar 30, 2023

gf2rl/david4

Reinforcement Learning • Updated Mar 30, 2023

gf2rl/h_size_2

Reinforcement Learning • Updated Mar 30, 2023

gf2rl/h_size_16_standard

Reinforcement Learning • Updated Mar 30, 2023

gf2rl/h_size_100_fail

Reinforcement Learning • Updated Mar 30, 2023

gf2rl/h_size_100_success_with_training_5000_episodes

Reinforcement Learning • Updated Mar 30, 2023

gf2rl/max_t_50_fail

Reinforcement Learning • Updated Mar 30, 2023

gf2rl/lr_1e-1_fail

Reinforcement Learning • Updated Mar 30, 2023

gf2rl/lr_1e-3_not_perfect_but_not_a_complete_fail

Reinforcement Learning • Updated Mar 30, 2023

gf2rl/gamma_0_05_fail

Reinforcement Learning • Updated Mar 30, 2023

OMARS200/Cartpole-v1

Reinforcement Learning • Updated Mar 30, 2023

gf2rl/gamma_0_5_Partial_fail

Reinforcement Learning • Updated Mar 30, 2023

gf2rl/partial_observability_pole_pose_only

Reinforcement Learning • Updated Mar 30, 2023

Isaac009/Reinforce-Pixelcopter-PLE-v0

Reinforcement Learning • Updated Mar 30, 2023

gf2rl/partial_observability_cart_pose_only

Reinforcement Learning • Updated Mar 30, 2023

hruslen/Reinforce-Pixelcopter-v0

Reinforcement Learning • Updated Apr 7, 2023

Hourai/Reinforce-CartPole-v1

Reinforcement Learning • Updated Mar 30, 2023

manuelmaiorano/Reinforce-Cartpole

Reinforcement Learning • Updated Mar 30, 2023

feratur/Reinforce-Pixelcopter-PLE-v0

Reinforcement Learning • Updated Mar 30, 2023

Ganu3010/Reinforce-Cartpole-v1

Reinforcement Learning • Updated Mar 30, 2023