Edit Models filters

Model Tree

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

custom-implementation

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

28,603

Base only

Active filters: custom-implementation

TUMxudashuai/Reinforce-CartPole-v1

Reinforcement Learning • Updated Dec 8, 2022

avisubedi/Reinforce-Pixelcopter-PLE-v0

Reinforcement Learning • Updated Dec 8, 2022

ThePianist/u8-ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 23, 2023 • 16

urechandro/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Dec 9, 2022

urechandro/q-Taxi-v3

Reinforcement Learning • Updated Dec 9, 2022

hanq0212/RL_course_unit1_part1

Reinforcement Learning • Updated Dec 9, 2022

hanq0212/RL_course_unit1_part2

Reinforcement Learning • Updated Dec 9, 2022

alicjak/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Dec 9, 2022

alicjak/q-Taxi-v3

Reinforcement Learning • Updated Dec 9, 2022

Jasmaur/FrozenLake-v1

Reinforcement Learning • Updated Dec 10, 2022

314anist/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Dec 10, 2022

314anist/q-Taxi-v3

Reinforcement Learning • Updated Dec 10, 2022

lithomas1/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Dec 10, 2022

lithomas1/q-Taxi-v3

Reinforcement Learning • Updated Dec 10, 2022

Clawoo/ppo-LunarLander-v2

Reinforcement Learning • Updated Feb 15, 2023 • 3

osanseviero/q-FrozenLake-v1-4x4-noSlippery-test

Reinforcement Learning • Updated Dec 10, 2022

osanseviero/q-FrozenLake-v1-4x4-noSlippery-test2

Reinforcement Learning • Updated Dec 10, 2022

osanseviero/q-FrozenLake-v1-4x4-noSlippery-test3

Reinforcement Learning • Updated Dec 10, 2022

osanseviero/q-FrozenLake-v1-4x4-noSlippery-test4

Reinforcement Learning • Updated Dec 10, 2022

osanseviero/q-Taxi-v3-nice

Reinforcement Learning • Updated Dec 10, 2022

Artachtron/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 1, 2023 • 4

JabrilJacobs/ppo-LunarLander-v2

Reinforcement Learning • Updated Aug 18, 2023 • 2

kebei/ppo-LunarLander-v2

Reinforcement Learning • Updated Jun 27, 2023 • 3

Honza/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 7, 2023 • 3

Isaacp/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 3, 2023 • 3

ThomasSimonini/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Dec 12, 2022

TomBrains/Reinforce-PolicyGradient

Reinforcement Learning • Updated Dec 12, 2022

osanseviero/q-FrozenLake-v1-4x4-noSlippery-wohoo

Reinforcement Learning • Updated Dec 12, 2022

osanseviero/super_taxi

Reinforcement Learning • Updated Dec 12, 2022

ChechkovEugene/ppo-LunarLander-v2

Reinforcement Learning • Updated Apr 14, 2023 • 2