Initial commit

Files changed (9) hide show

README.md CHANGED Viewed

@@ -16,7 +16,7 @@ model-index:
       type: SpaceInvadersNoFrameskip-v4
     metrics:
     - type: mean_reward
-      value: 218.50 +/- 65.69
       name: mean_reward
       verified: false
 ---
@@ -63,8 +63,8 @@ python -m rl_zoo3.push_to_hub --algo dqn --env SpaceInvadersNoFrameskip-v4 -f lo
 ## Hyperparameters
 ```python
-OrderedDict([('batch_size', 64),
-             ('buffer_size', 250000),
              ('env_wrapper',
               ['stable_baselines3.common.atari_wrappers.AtariWrapper']),
              ('exploration_final_eps', 0.01),
@@ -73,7 +73,7 @@ OrderedDict([('batch_size', 64),
              ('gradient_steps', 1),
              ('learning_rate', 0.0001),
              ('learning_starts', 100000),
-             ('n_timesteps', 170000.0),
              ('optimize_memory_usage', False),
              ('policy', 'CnnPolicy'),
              ('target_update_interval', 1000),

       type: SpaceInvadersNoFrameskip-v4
     metrics:
     - type: mean_reward
+      value: 745.00 +/- 273.87
       name: mean_reward
       verified: false
 ---
 ## Hyperparameters
 ```python
+OrderedDict([('batch_size', 32),
+             ('buffer_size', 100000),
              ('env_wrapper',
               ['stable_baselines3.common.atari_wrappers.AtariWrapper']),
              ('exploration_final_eps', 0.01),
              ('gradient_steps', 1),
              ('learning_rate', 0.0001),
              ('learning_starts', 100000),
+             ('n_timesteps', 1000000.0),
              ('optimize_memory_usage', False),
              ('policy', 'CnnPolicy'),
              ('target_update_interval', 1000),

args.yml CHANGED Viewed

@@ -20,7 +20,7 @@
   - - hyperparams
     - null
   - - log_folder
-    - logs/
   - - log_interval
     - -1
   - - max_total_trials
@@ -56,7 +56,7 @@
   - - save_replay_buffer
     - false
   - - seed
-    - 463663602
   - - storage
     - null
   - - study_name

   - - hyperparams
     - null
   - - log_folder
+    - logs
   - - log_interval
     - -1
   - - max_total_trials
   - - save_replay_buffer
     - false
   - - seed
+    - 791084428
   - - storage
     - null
   - - study_name

config.yml CHANGED Viewed

@@ -1,8 +1,8 @@
 !!python/object/apply:collections.OrderedDict
 - - - batch_size
-    - 64
   - - buffer_size
-    - 250000
   - - env_wrapper
     - - stable_baselines3.common.atari_wrappers.AtariWrapper
   - - exploration_final_eps
@@ -18,7 +18,7 @@
   - - learning_starts
     - 100000
   - - n_timesteps
-    - 170000.0
   - - optimize_memory_usage
     - false
   - - policy

 !!python/object/apply:collections.OrderedDict
 - - - batch_size
+    - 32
   - - buffer_size
+    - 100000
   - - env_wrapper
     - - stable_baselines3.common.atari_wrappers.AtariWrapper
   - - exploration_final_eps
   - - learning_starts
     - 100000
   - - n_timesteps
+    - 1000000.0
   - - optimize_memory_usage
     - false
   - - policy

dqn-SpaceInvadersNoFrameskip-v4.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6ca7e6a43fa0b901213b164b339c4dc54508741903991e78cbd69666a7f7c87a
-size 27218403

 version https://git-lfs.github.com/spec/v1
+oid sha256:3244d21e9ee797c84f7015e245c1f30e834a02e5dbae810e61e6a2ef807d31d6
+size 27218408

dqn-SpaceInvadersNoFrameskip-v4/data CHANGED Viewed

The diff for this file is too large to render. See raw diff

dqn-SpaceInvadersNoFrameskip-v4/policy.optimizer.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d8b95a83c378d17d3e840438785f9ad4d3092b66a01167e07cfa9e2e56011552
 size 13506172

 version https://git-lfs.github.com/spec/v1
+oid sha256:51f06cb14f82388d4f8dfb3a49ea3bed40a0c75c43353fc1c409262e38e02b74
 size 13506172

dqn-SpaceInvadersNoFrameskip-v4/policy.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6db490c8b2cd077018e6c81096aa419a8aed371fb46267615d4621d61b3e14b1
 size 13505370

 version https://git-lfs.github.com/spec/v1
+oid sha256:4d1a00101171b16017a55e443330313616c69b446817085279474d711e0ee910
 size 13505370

results.json CHANGED Viewed

	@@ -1 +1 @@
1	- {"mean_reward": ~~218~~.5, "std_reward": 65.~~69056248807739~~, "is_deterministic": false, "n_eval_episodes": 10, "eval_datetime": "2025-05-~~20T16~~:26:50.~~383411~~"}


1	+ {"mean_reward": 745.0, "std_reward": 273.87040730973473, "is_deterministic": false, "n_eval_episodes": 10, "eval_datetime": "2025-05-23T15:17:35.844228"}

train_eval_metrics.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d919a768479ef9d6f651ced9f866bd220f4544e750f10d41a169f26ab69f3293
-size 8350

 version https://git-lfs.github.com/spec/v1
+oid sha256:128dc933eaf2a21558c9777eb633b142a3a853c193e7662c355a1b7b28827a07
+size 35748