Edit Models filters

Model Tree

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

custom-implementation

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

28,595

Base only

Active filters: custom-implementation

jcastanyo/Reinforce-CP-v1

Reinforcement Learning • Updated Sep 14, 2022

michael20at/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Sep 14, 2022

michael20at/q-FrozenLake-v1-4x4-isSlippery

Reinforcement Learning • Updated Sep 14, 2022

michael20at/q-Taxi-v3

Reinforcement Learning • Updated Sep 14, 2022

xusysh/Reinforce-test-1

Reinforcement Learning • Updated Sep 15, 2022

xusysh/Reinforce-PixelCopter-test-1

Reinforcement Learning • Updated Sep 15, 2022

huijian222/pixelcopter-simple-50000eps

Reinforcement Learning • Updated Sep 15, 2022

xusysh/Reinforce-pong-test-1

Reinforcement Learning • Updated Sep 15, 2022

matemato/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Sep 16, 2022

Eksperymenty/Reinforce-CartPole-v1

Reinforcement Learning • Updated Sep 17, 2022

Eksperymenty/Pixelcopter-PLE-v0

Reinforcement Learning • Updated Sep 17, 2022

Eksperymenty/Pong-PLE-v0

Reinforcement Learning • Updated Sep 17, 2022

matemato/q-Taxi-v3

Reinforcement Learning • Updated Sep 17, 2022

anechaev/Reinforce-U5CartPole

Reinforcement Learning • Updated Sep 17, 2022

anechaev/Reinforce-U5Pixelcopter

Reinforcement Learning • Updated Sep 17, 2022

SimingSiming/pong-policy

Reinforcement Learning • Updated Dec 2, 2022

pikodemo/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Sep 19, 2022

pikodemo/q-Taxi-v3

Reinforcement Learning • Updated Sep 19, 2022

rram12/q-Taxi-v3

Reinforcement Learning • Updated Sep 20, 2022

rram12/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Sep 20, 2022

Ricardmc99/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Sep 20, 2022

Ricardmc99/q-Taxi-v3

Reinforcement Learning • Updated Sep 20, 2022

adil-o/A2C-Cartpole-v1

Reinforcement Learning • Updated Sep 20, 2022

adil-o/A2C-Pixelcopter-v1

Reinforcement Learning • Updated Sep 20, 2022

adil-o/A2C-Pong-v1

Reinforcement Learning • Updated Sep 20, 2022

adil-o/ppo-CartPole-v1

Reinforcement Learning • Updated Sep 20, 2022

vivpavlov/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Sep 23, 2022

mayorov-s/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Sep 20, 2023

mayorov-s/q-Taxi-v3

Reinforcement Learning • Updated Sep 21, 2022

jgiral95/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Sep 21, 2022