Initial commit

Files changed (10) hide show

README.md CHANGED Viewed

@@ -16,7 +16,7 @@ model-index:
       type: SpaceInvadersNoFrameskip-v4
     metrics:
     - type: mean_reward
-      value: 159.50 +/- 131.44
       name: mean_reward
       verified: false
 ---
@@ -63,7 +63,7 @@ python -m rl_zoo3.push_to_hub --algo dqn --env SpaceInvadersNoFrameskip-v4 -f lo
 ## Hyperparameters
 ```python
-OrderedDict([('batch_size', 512),
              ('buffer_size', 1000000),
              ('env_wrapper',
               ['stable_baselines3.common.atari_wrappers.AtariWrapper']),
@@ -71,7 +71,7 @@ OrderedDict([('batch_size', 512),
              ('exploration_fraction', 0.1),
              ('frame_stack', 4),
              ('gradient_steps', 1),
-             ('learning_rate', 0.0003),
              ('learning_starts', 100000),
              ('n_timesteps', 1000000.0),
              ('optimize_memory_usage', False),

       type: SpaceInvadersNoFrameskip-v4
     metrics:
     - type: mean_reward
+      value: 516.00 +/- 168.59
       name: mean_reward
       verified: false
 ---
 ## Hyperparameters
 ```python
+OrderedDict([('batch_size', 1024),
              ('buffer_size', 1000000),
              ('env_wrapper',
               ['stable_baselines3.common.atari_wrappers.AtariWrapper']),
              ('exploration_fraction', 0.1),
              ('frame_stack', 4),
              ('gradient_steps', 1),
+             ('learning_rate', 0.0001),
              ('learning_starts', 100000),
              ('n_timesteps', 1000000.0),
              ('optimize_memory_usage', False),

args.yml CHANGED Viewed

@@ -46,7 +46,7 @@
   - - optimize_hyperparameters
     - false
   - - progress
-    - false
   - - pruner
     - median
   - - sampler
@@ -56,7 +56,7 @@
   - - save_replay_buffer
     - false
   - - seed
-    - 2969151151
   - - storage
     - null
   - - study_name

   - - optimize_hyperparameters
     - false
   - - progress
+    - true
   - - pruner
     - median
   - - sampler
   - - save_replay_buffer
     - false
   - - seed
+    - 634099584
   - - storage
     - null
   - - study_name

config.yml CHANGED Viewed

@@ -1,6 +1,6 @@
 !!python/object/apply:collections.OrderedDict
 - - - batch_size
-    - 512
   - - buffer_size
     - 1000000
   - - env_wrapper
@@ -14,7 +14,7 @@
   - - gradient_steps
     - 1
   - - learning_rate
-    - 0.0003
   - - learning_starts
     - 100000
   - - n_timesteps

 !!python/object/apply:collections.OrderedDict
 - - - batch_size
+    - 1024
   - - buffer_size
     - 1000000
   - - env_wrapper
   - - gradient_steps
     - 1
   - - learning_rate
+    - 0.0001
   - - learning_starts
     - 100000
   - - n_timesteps

dqn-SpaceInvadersNoFrameskip-v4.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e7e5004a7ad6b0045f7ec5d5fa04aac520d975841a987b3321840680a3adc207
-size 27220522

 version https://git-lfs.github.com/spec/v1
+oid sha256:0d2a3cfaacf568efccd0e3fb7c638312f19848beb66d157b2bc11880f1f86236
+size 27221034

dqn-SpaceInvadersNoFrameskip-v4/data CHANGED Viewed

The diff for this file is too large to render. See raw diff

dqn-SpaceInvadersNoFrameskip-v4/policy.optimizer.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a0c14524923fecd5544c2bbaa61e8514ce9b75ab2d42536a6604028f8305ae4c
-size 13505852

 version https://git-lfs.github.com/spec/v1
+oid sha256:813386f26ac13747d343b8a49a99b3f2ff154c74e743cbd42b8020b82d893340
+size 13506172

dqn-SpaceInvadersNoFrameskip-v4/policy.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b2fc41c607aff5e7599ff9807ffb7cdb814c9eacfcc6cc4e0ae4978adddfad12
-size 13505178

 version https://git-lfs.github.com/spec/v1
+oid sha256:66d72118acea1ef718f53a1d38bc780c45e6881db93f768562d314252e305887
+size 13505370

dqn-SpaceInvadersNoFrameskip-v4/system_info.txt CHANGED Viewed

@@ -2,7 +2,7 @@
 - Python: 3.12.3
 - Stable-Baselines3: 2.5.0
 - PyTorch: 2.3.0+cu121
-- GPU Enabled: False
 - Numpy: 1.26.4
 - Cloudpickle: 3.1.1
 - Gymnasium: 1.0.0

 - Python: 3.12.3
 - Stable-Baselines3: 2.5.0
 - PyTorch: 2.3.0+cu121
+- GPU Enabled: True
 - Numpy: 1.26.4
 - Cloudpickle: 3.1.1
 - Gymnasium: 1.0.0

results.json CHANGED Viewed

	@@ -1 +1 @@
1	- {"mean_reward": ~~159~~.5, "std_reward": ~~131~~.~~44295340565046~~, "is_deterministic": false, "n_eval_episodes": 10, "eval_datetime": "2025-02-~~17T12~~:30:17.~~019987~~"}


1	+ {"mean_reward": 516.0, "std_reward": 168.59418732566078, "is_deterministic": false, "n_eval_episodes": 10, "eval_datetime": "2025-02-18T09:06:19.832823"}

train_eval_metrics.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:31c8e97f9eb7302df6b40e6196d8c46e0adab236d7243e51be32b94180e0f329
-size 38926

 version https://git-lfs.github.com/spec/v1
+oid sha256:40acfa5007220678e4615dece548d98e6050a3d16660db02751724a729425547
+size 35915