Upload folder using huggingface_hub

Files changed (5) hide show

README.md ADDED Viewed

+---
+tags:
+- Pixelcopter-PLE-v0
+- reinforce
+- reinforcement-learning
+- custom-implementation
+- deep-rl-class
+model-index:
+- name: Reinforce-Pixelcopter
+  results:
+  - task:
+      type: reinforcement-learning
+      name: reinforcement-learning
+    dataset:
+      name: Pixelcopter-PLE-v0
+      type: Pixelcopter-PLE-v0
+    metrics:
+    - type: mean_reward
+      value: 16.83 +/- 15.75
+      name: mean_reward
+      verified: false
+---
+  # **Reinforce** Agent playing **Pixelcopter-PLE-v0**
+  This is a trained model of a **Reinforce** agent playing **Pixelcopter-PLE-v0** .
+  To learn to use this model and train yours check Unit 4 of the Deep Reinforcement Learning Course: https://huggingface.co/deep-rl-course/unit4/introduction
+  My name is VanDat =))

hyperparameters.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"env_id": "Pixelcopter-PLE-v0", "state_size": 7, "action_size": 2, "hidden_size": 128, "training_episodes": 10000, "evaluate_episodes": 100, "max_step": 1000, "gamma": 0.9, "lr": 0.0001, "print_per_episodes": 100}

model.pt ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:aa2e162b23cf39183b40ebcaa4f1cea70b9565f42e04b75d99de1e5ba96ecf5b
+size 141620

replay.mp4 ADDED Viewed

Binary file (7.8 kB). View file

results.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"env_id": "Pixelcopter-PLE-v0", "mean_reward": 16.83, "n_evaluation_episodes": 100, "eval_datetime": "2025-05-23T11:47:53.102733"}