Initial commit

Files changed (10) hide show

README.md CHANGED Viewed

@@ -16,7 +16,7 @@ model-index:
       type: SpaceInvadersNoFrameskip-v4
     metrics:
     - type: mean_reward
-      value: 374.00 +/- 214.61
       name: mean_reward
       verified: false
 ---
@@ -57,11 +57,14 @@ python -m rl_zoo3.push_to_hub --algo qrdqn --env SpaceInvadersNoFrameskip-v4 -f
 ## Hyperparameters
 ```python
-OrderedDict([('env_wrapper',
               ['stable_baselines3.common.atari_wrappers.AtariWrapper']),
-             ('exploration_fraction', 0.025),
-             ('frame_stack', 4),
-             ('n_timesteps', 10000000.0),
              ('normalize', False),
              ('optimize_memory_usage', False),
              ('policy', 'CnnPolicy')])

       type: SpaceInvadersNoFrameskip-v4
     metrics:
     - type: mean_reward
+      value: 374.00 +/- 214.89
       name: mean_reward
       verified: false
 ---
 ## Hyperparameters
 ```python
+OrderedDict([('batch_size', 128),
+             ('buffer_size', 25000),
+             ('env_wrapper',
               ['stable_baselines3.common.atari_wrappers.AtariWrapper']),
+             ('exploration_fraction', 0.225),
+             ('frame_stack', 3),
+             ('learning_rate', 0.023),
+             ('n_timesteps', 1000000.0),
              ('normalize', False),
              ('optimize_memory_usage', False),
              ('policy', 'CnnPolicy')])

args.yml CHANGED Viewed

@@ -54,7 +54,7 @@
   - - save_replay_buffer
     - false
   - - seed
-    - 2716145110
   - - storage
     - null
   - - study_name

   - - save_replay_buffer
     - false
   - - seed
+    - 239030764
   - - storage
     - null
   - - study_name

config.yml CHANGED Viewed

@@ -1,12 +1,18 @@
 !!python/object/apply:collections.OrderedDict
-- - - env_wrapper
     - - stable_baselines3.common.atari_wrappers.AtariWrapper
   - - exploration_fraction
-    - 0.025
   - - frame_stack
-    - 4
   - - n_timesteps
-    - 10000000.0
   - - normalize
     - false
   - - optimize_memory_usage

 !!python/object/apply:collections.OrderedDict
+- - - batch_size
+    - 128
+  - - buffer_size
+    - 25000
+  - - env_wrapper
     - - stable_baselines3.common.atari_wrappers.AtariWrapper
   - - exploration_fraction
+    - 0.225
   - - frame_stack
+    - 3
+  - - learning_rate
+    - 0.023
   - - n_timesteps
+    - 1000000.0
   - - normalize
     - false
   - - optimize_memory_usage

qrdqn-SpaceInvadersNoFrameskip-v4.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fff5b1396cc4a901958c7db4e72e57d1115696aae4916bc139a8a198554e6551
-size 37024704

 version https://git-lfs.github.com/spec/v1
+oid sha256:120ef15d0209483649ecebe0e24b3ff58bf3cf66a97c61bf21c21e395521f859
+size 36945029

qrdqn-SpaceInvadersNoFrameskip-v4/data CHANGED Viewed

The diff for this file is too large to render. See raw diff

qrdqn-SpaceInvadersNoFrameskip-v4/policy.optimizer.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9c441c8f52d4af97870e05a40abdcdf9499e9e45023f5c239298fda57c1903ca
-size 18405643

 version https://git-lfs.github.com/spec/v1
+oid sha256:9244e5ab703009b19916f7d73abe97001d6def24745760b9485103058a122df3
+size 18389259

qrdqn-SpaceInvadersNoFrameskip-v4/policy.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9c0402d889eb896d6d674b9e393872b9b013cd65662666d0468b042add506b08
-size 18405353

 version https://git-lfs.github.com/spec/v1
+oid sha256:e2ca02aca8aafe7fe2a3bcbc11cda01ac4cd7de57fd1c8999a89fda566ca3706
+size 18388969

replay.mp4 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ce89df131229debcd89c2cee8e698032c646e7fc35309d76c26d6972a0e0cc9e
-size 252552

 version https://git-lfs.github.com/spec/v1
+oid sha256:9e8c07008011ea7e4922b6a6de09b13e7f52fa64a66d87ba4e11bff4bfc5d28b
+size 234706

results.json CHANGED Viewed

	@@ -1 +1 @@
1	- {"mean_reward": 374.0, "std_reward": 214.~~61360627881913~~, "is_deterministic": false, "n_eval_episodes": 10, "eval_datetime": "2022-12-~~28T22~~:18:00.~~700517~~"}


1	+ {"mean_reward": 374.0, "std_reward": 214.89299662855464, "is_deterministic": false, "n_eval_episodes": 10, "eval_datetime": "2022-12-29T10:24:45.175634"}

train_eval_metrics.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:72697a18adec22ea6400c3fff5eaf39793481eb1547a107aec1164cb53f1ea32
-size 27147

 version https://git-lfs.github.com/spec/v1
+oid sha256:950112a1661a16b588c666c4ac674b8a66b21e516331e6ebef4dde41310b1fda
+size 42425