Initial commit

Files changed (10) hide show

README.md CHANGED Viewed

@@ -16,7 +16,7 @@ model-index:
       type: SpaceInvadersNoFrameskip-v4
     metrics:
     - type: mean_reward
-      value: 671.00 +/- 204.81
       name: mean_reward
       verified: false
 ---
@@ -64,14 +64,14 @@ python -m rl_zoo3.push_to_hub --algo dqn --env SpaceInvadersNoFrameskip-v4 -f lo
 ## Hyperparameters
 ```python
 OrderedDict([('batch_size', 32),
-             ('buffer_size', 200000),
              ('env_wrapper',
               ['stable_baselines3.common.atari_wrappers.AtariWrapper']),
              ('exploration_final_eps', 0.01),
              ('exploration_fraction', 0.1),
              ('frame_stack', 4),
              ('gradient_steps', 1),
-             ('learning_rate', 0.0001),
              ('learning_starts', 100000),
              ('n_timesteps', 1000000.0),
              ('optimize_memory_usage', False),

       type: SpaceInvadersNoFrameskip-v4
     metrics:
     - type: mean_reward
+      value: 263.50 +/- 141.55
       name: mean_reward
       verified: false
 ---
 ## Hyperparameters
 ```python
 OrderedDict([('batch_size', 32),
+             ('buffer_size', 100000),
              ('env_wrapper',
               ['stable_baselines3.common.atari_wrappers.AtariWrapper']),
              ('exploration_final_eps', 0.01),
              ('exploration_fraction', 0.1),
              ('frame_stack', 4),
              ('gradient_steps', 1),
+             ('learning_rate', 1e-05),
              ('learning_starts', 100000),
              ('n_timesteps', 1000000.0),
              ('optimize_memory_usage', False),

args.yml CHANGED Viewed

@@ -56,7 +56,7 @@
   - - save_replay_buffer
     - false
   - - seed
-    - 3020163880
   - - storage
     - null
   - - study_name

   - - save_replay_buffer
     - false
   - - seed
+    - 2719719223
   - - storage
     - null
   - - study_name

config.yml CHANGED Viewed

@@ -2,7 +2,7 @@
 - - - batch_size
     - 32
   - - buffer_size
-    - 200000
   - - env_wrapper
     - - stable_baselines3.common.atari_wrappers.AtariWrapper
   - - exploration_final_eps
@@ -14,7 +14,7 @@
   - - gradient_steps
     - 1
   - - learning_rate
-    - 0.0001
   - - learning_starts
     - 100000
   - - n_timesteps

 - - - batch_size
     - 32
   - - buffer_size
+    - 100000
   - - env_wrapper
     - - stable_baselines3.common.atari_wrappers.AtariWrapper
   - - exploration_final_eps
   - - gradient_steps
     - 1
   - - learning_rate
+    - 1.0e-05
   - - learning_starts
     - 100000
   - - n_timesteps

dqn-SpaceInvadersNoFrameskip-v4.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a43bf9e556547f929b1daa63e3eb7062f54bf0c807ff4c85ccf6ef11b73301a0
-size 27219633

 version https://git-lfs.github.com/spec/v1
+oid sha256:23abe03056c37d7a85f27aec66bb69f50dffbc66dd2c2551d5edfddb334af517
+size 27219627

dqn-SpaceInvadersNoFrameskip-v4/data CHANGED Viewed

The diff for this file is too large to render. See raw diff

dqn-SpaceInvadersNoFrameskip-v4/policy.optimizer.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5792e711e306ec087efec3a3e49636873cf1a86f70b1c70f297129676a060b7a
 size 13506569

 version https://git-lfs.github.com/spec/v1
+oid sha256:163378d0479fe846bbea75af5e16c3a6284a471e89573882ec152238a2ee0f95
 size 13506569

dqn-SpaceInvadersNoFrameskip-v4/policy.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:980d3415d6b72c3af363047077e416efbff944268c5f9aa8ace221a0d62e8356
 size 13505767

 version https://git-lfs.github.com/spec/v1
+oid sha256:2cedc968ac18e4fc1d1b1c2b9ddcb6abc0bcce7c440fd2fefd6d5a9e3bd6a8df
 size 13505767

replay.mp4 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:27de79b1a4a2f208937c18bfb6820867e0b56f379d7d90321dd0c9bf0c874576
-size 202606

 version https://git-lfs.github.com/spec/v1
+oid sha256:eb3b9257439e10c6943122585960fca8eb4859b77abc983f692979c0ff984fa4
+size 254190

results.json CHANGED Viewed

	@@ -1 +1 @@
1	- {"mean_reward": ~~671~~.0, "std_reward": ~~204~~.~~81455026437942~~, "is_deterministic": false, "n_eval_episodes": 10, "eval_datetime": "2025-09-~~23T02~~:59:34.~~337278~~"}


1	+ {"mean_reward": 263.5, "std_reward": 141.54592894181027, "is_deterministic": false, "n_eval_episodes": 10, "eval_datetime": "2025-09-23T03:38:52.287127"}

train_eval_metrics.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a8d5ef3e82d430a47144785d1bd8743bc02ee733a379c85ad0d49b24fad70149
-size 35925

 version https://git-lfs.github.com/spec/v1
+oid sha256:1e9d3b63072ab00eb3e9b41271a7421ed17a24e6f8e6f873c88b109757a7dd87
+size 42305