Initial commit

Files changed (10) hide show

README.md CHANGED Viewed

@@ -16,7 +16,7 @@ model-index:
       type: SpaceInvadersNoFrameskip-v4
     metrics:
     - type: mean_reward
-      value: 102.50 +/- 73.05
       name: mean_reward
       verified: false
 ---
@@ -66,16 +66,14 @@ OrderedDict([('batch_size', 128),
              ('buffer_size', 50000),
              ('env_wrapper',
               ['stable_baselines3.common.atari_wrappers.AtariWrapper']),
-             ('exploration_final_eps', 0.1),
-             ('exploration_fraction', 0.25),
-             ('gamma', 0.99),
              ('gradient_steps', -1),
              ('learning_rate', 0.00063),
              ('learning_starts', 0),
              ('n_timesteps', 100000.0),
              ('policy', 'CnnPolicy'),
              ('policy_kwargs', 'dict(net_arch=[256, 256])'),
-             ('target_update_interval', 250),
              ('train_freq', 4),
              ('normalize', False)])
 ```

       type: SpaceInvadersNoFrameskip-v4
     metrics:
     - type: mean_reward
+      value: 158.50 +/- 118.70
       name: mean_reward
       verified: false
 ---
              ('buffer_size', 50000),
              ('env_wrapper',
               ['stable_baselines3.common.atari_wrappers.AtariWrapper']),
+             ('gamma', 0.95),
              ('gradient_steps', -1),
              ('learning_rate', 0.00063),
              ('learning_starts', 0),
              ('n_timesteps', 100000.0),
              ('policy', 'CnnPolicy'),
              ('policy_kwargs', 'dict(net_arch=[256, 256])'),
+             ('target_update_interval', 100),
              ('train_freq', 4),
              ('normalize', False)])
 ```

args.yml CHANGED Viewed

@@ -54,7 +54,7 @@
   - - save_replay_buffer
     - false
   - - seed
-    - 2295009967
   - - storage
     - null
   - - study_name

   - - save_replay_buffer
     - false
   - - seed
+    - 1256430113
   - - storage
     - null
   - - study_name

config.yml CHANGED Viewed

@@ -5,12 +5,8 @@
     - 50000
   - - env_wrapper
     - - stable_baselines3.common.atari_wrappers.AtariWrapper
-  - - exploration_final_eps
-    - 0.1
-  - - exploration_fraction
-    - 0.25
   - - gamma
-    - 0.99
   - - gradient_steps
     - -1
   - - learning_rate
@@ -24,6 +20,6 @@
   - - policy_kwargs
     - dict(net_arch=[256, 256])
   - - target_update_interval
-    - 250
   - - train_freq
     - 4

     - 50000
   - - env_wrapper
     - - stable_baselines3.common.atari_wrappers.AtariWrapper
   - - gamma
+    - 0.95
   - - gradient_steps
     - -1
   - - learning_rate
   - - policy_kwargs
     - dict(net_arch=[256, 256])
   - - target_update_interval
+    - 100
   - - train_freq
     - 4

dqn-SpaceInvadersNoFrameskip-v4.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ea3a66c3bccb180203c0734f71f687ccc0c9d980d8d1a93cbd28755450f7cd10
-size 30113655

 version https://git-lfs.github.com/spec/v1
+oid sha256:66cd778412b1d0ad8587b32918cf4dfa2f33718944f2dc2a75124355f9fe4813
+size 30113656

dqn-SpaceInvadersNoFrameskip-v4/data CHANGED Viewed

The diff for this file is too large to render. See raw diff

dqn-SpaceInvadersNoFrameskip-v4/policy.optimizer.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2381e6426f404c41e337f0d2b9115343ec7f4b3436a53ad8eb9cd801bee5f089
 size 15025112

 version https://git-lfs.github.com/spec/v1
+oid sha256:b823f49717325b1122d6cc4de199133f0aae7ef301feb743fb53160bd8e9a9d4
 size 15025112

dqn-SpaceInvadersNoFrameskip-v4/policy.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5080588f52c98bfd7ef2967cf2e27b4d7016dcc9b6582842f6cc4b710da7181e
 size 15023810

 version https://git-lfs.github.com/spec/v1
+oid sha256:c323947627f5faa0c3a1d90aa5219ea0491e9655630b154638c1473ec91158b3
 size 15023810

replay.mp4 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b5d5175704e77de5a980f11351b5af0513e61094b8812c11a15ca1264c36f375
-size 265515

 version https://git-lfs.github.com/spec/v1
+oid sha256:58774d71cd06b47134d8b232dea82f40a2029e6adbd9fbba03d256e079eeabdb
+size 258119

results.json CHANGED Viewed

	@@ -1 +1 @@
1	- {"mean_reward": ~~102~~.5, "std_reward": 73.~~04964065620035~~, "is_deterministic": false, "n_eval_episodes": 10, "eval_datetime": "2023-10-30T04:36:09.~~013001~~"}


1	+ {"mean_reward": 158.5, "std_reward": 118.70235886451457, "is_deterministic": false, "n_eval_episodes": 10, "eval_datetime": "2023-10-30T04:54:18.799653"}

train_eval_metrics.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:007ee147aa2853d557fcd438b1fcb1b758818dd45d3e512ec08254c0cc5e14fb
-size 5467

 version https://git-lfs.github.com/spec/v1
+oid sha256:af32a836ad167e551555618b057a8e5aff3df8b3afdc20f10e552e70aea1eea5
+size 5316