Edit Models filters

Model Tree

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

One-click Deployment

Inference Endpoints

Microsoft Foundry

Amazon SageMaker AI

Misc

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

8,591

Base only

Active filters: deep-rl-class

Feldi/Reinforce-PoleBalancing

Reinforcement Learning • Updated Mar 11, 2023

Feldi/PixelCopter-reinforce-v2

Reinforcement Learning • Updated Mar 11, 2023

nsecord/Reinforce-Pixelcopter-PLE-v0-2

Reinforcement Learning • Updated Mar 11, 2023

PabloTa/Reinforce-unit4-pixelCopter

Reinforcement Learning • Updated Mar 14, 2023

Fer14/Reinforce-Helicopter

Reinforcement Learning • Updated Mar 13, 2023

Nasree/Reinforce-CartPole-v1

Reinforcement Learning • Updated Mar 11, 2023

Nasree/Reinforce-PixelCopter

Reinforcement Learning • Updated Mar 11, 2023

hmatzner/Reinforce-Cartpole-v1

Reinforcement Learning • Updated Mar 11, 2023

Nasree/Reinforce-PixelCopter2

Reinforcement Learning • Updated Mar 11, 2023

alexdavey/Reinforce-CartPole-v1

Reinforcement Learning • Updated Apr 7, 2023

hmatzner/Reinforce-Pixelcopter-PLE-v0

Reinforcement Learning • Updated Mar 11, 2023

M331/Pixelcopter-PLE-v0

Reinforcement Learning • Updated Mar 13, 2023

FutureDesire/Reinforce

Reinforcement Learning • Updated Mar 12, 2023

FutureDesire/Reinforce-pixelcopter

Reinforcement Learning • Updated Mar 12, 2023

avoroshilov/Reinforce-CartPole-v1

Reinforcement Learning • Updated Mar 12, 2023

avoroshilov/Reinforce-Pixelcopter-PLE-v0

Reinforcement Learning • Updated Mar 12, 2023

D0k-tor/Pixelcopter-PLE-v0-Dani

Reinforcement Learning • Updated Mar 12, 2023

Feldi/Reinforce-PixelCopter-v2

Reinforcement Learning • Updated Mar 12, 2023

ankandrew/Reinforce-PixelCopter-v1

Reinforcement Learning • Updated Mar 12, 2023

D0k-tor/Pixelcopter-PLE-v1-Dani

Reinforcement Learning • Updated Mar 12, 2023

danendra/CartPole-v1

Reinforcement Learning • Updated Mar 12, 2023

varevshatyan/Reinforce-CartPole-v1

Reinforcement Learning • Updated Mar 12, 2023

pomp/Cart-Pole-V1

Reinforcement Learning • Updated Mar 12, 2023

alvarez/Reinforce-Cart_Pole_001

Reinforcement Learning • Updated Mar 12, 2023

pomp/PixelCopter

Reinforcement Learning • Updated Mar 12, 2023

nsecord/Reinforce-Pixelcopter-PLE-v0-3

Reinforcement Learning • Updated Mar 12, 2023

PabloTa/Reinforce-unit4-pixelCopter3

Reinforcement Learning • Updated Mar 12, 2023

varevshatyan/Reinforce-PixelCopter

Reinforcement Learning • Updated Mar 12, 2023

dyingc/Reinforce-policy-gradient

Reinforcement Learning • Updated Mar 12, 2023

Suprabound/CartPole-Gradient-Policy

Reinforcement Learning • Updated Mar 12, 2023