Initial commit

Files changed (11) hide show

README.md CHANGED Viewed

@@ -16,7 +16,7 @@ model-index:
       type: SpaceInvadersNoFrameskip-v4
     metrics:
     - type: mean_reward
-      value: 268.50 +/- 78.17
       name: mean_reward
       verified: false
 ---
@@ -73,7 +73,7 @@ OrderedDict([('batch_size', 32),
              ('gradient_steps', 1),
              ('learning_rate', 0.0001),
              ('learning_starts', 100000),
-             ('n_timesteps', 100000.0),
              ('optimize_memory_usage', False),
              ('policy', 'CnnPolicy'),
              ('target_update_interval', 1000),

       type: SpaceInvadersNoFrameskip-v4
     metrics:
     - type: mean_reward
+      value: 691.50 +/- 233.57
       name: mean_reward
       verified: false
 ---
              ('gradient_steps', 1),
              ('learning_rate', 0.0001),
              ('learning_starts', 100000),
+             ('n_timesteps', 1000000.0),
              ('optimize_memory_usage', False),
              ('policy', 'CnnPolicy'),
              ('target_update_interval', 1000),

args.yml CHANGED Viewed

@@ -2,7 +2,7 @@
 - - - algo
     - dqn
   - - conf_file
-    - dqn.yaml
   - - device
     - auto
   - - env
@@ -20,7 +20,7 @@
   - - hyperparams
     - null
   - - log_folder
-    - ./logs
   - - log_interval
     - -1
   - - max_total_trials
@@ -56,7 +56,7 @@
   - - save_replay_buffer
     - false
   - - seed
-    - 1972458656
   - - storage
     - null
   - - study_name
@@ -67,6 +67,8 @@
     - false
   - - trained_agent
     - ''
   - - truncate_last_trajectory
     - true
   - - uuid

 - - - algo
     - dqn
   - - conf_file
+    - dqn.yml
   - - device
     - auto
   - - env
   - - hyperparams
     - null
   - - log_folder
+    - logs/
   - - log_interval
     - -1
   - - max_total_trials
   - - save_replay_buffer
     - false
   - - seed
+    - 574385412
   - - storage
     - null
   - - study_name
     - false
   - - trained_agent
     - ''
+  - - trial_id
+    - null
   - - truncate_last_trajectory
     - true
   - - uuid

config.yml CHANGED Viewed

@@ -18,7 +18,7 @@
   - - learning_starts
     - 100000
   - - n_timesteps
-    - 100000.0
   - - optimize_memory_usage
     - false
   - - policy

   - - learning_starts
     - 100000
   - - n_timesteps
+    - 1000000.0
   - - optimize_memory_usage
     - false
   - - policy

dqn-SpaceInvadersNoFrameskip-v4.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9fbe81d5d5eeb8611129f69716bd200a14f44429681e230ccb1eb99ff2e4db92
-size 13715966

 version https://git-lfs.github.com/spec/v1
+oid sha256:61540cd6d4da45f309a150bcdfded7d034ac360e8e2af306ee74b999bd6afa5d
+size 27221651

dqn-SpaceInvadersNoFrameskip-v4/_stable_baselines3_version CHANGED Viewed

	@@ -1 +1 @@
1	- 2.6.~~0a2~~


1	+ 2.6.0

dqn-SpaceInvadersNoFrameskip-v4/data CHANGED Viewed

The diff for this file is too large to render. See raw diff

dqn-SpaceInvadersNoFrameskip-v4/policy.optimizer.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:215ea7d8898faa9284464c7109532cf36390d330fccab8d77eeba20628a32876
-size 1120

 version https://git-lfs.github.com/spec/v1
+oid sha256:7bc9be1419452c38e33c6c639c7e33dfd08ae9fb2e52908040fb99458e9ca832
+size 13506172

dqn-SpaceInvadersNoFrameskip-v4/policy.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3866714963ba1fd5b89b78200d5dd1db44afa1d7142d6207f11d05d03bcd007e
 size 13505370

 version https://git-lfs.github.com/spec/v1
+oid sha256:bcfa6ce7f1faeea0e9b563b8f39d4b0de6b820636bb48462d12ee344b95c6e99
 size 13505370

dqn-SpaceInvadersNoFrameskip-v4/system_info.txt CHANGED Viewed

@@ -1,9 +1,9 @@
-- OS: Linux-6.1.85+-x86_64-with-glibc2.35 # 1 SMP PREEMPT_DYNAMIC Thu Jun 27 21:05:47 UTC 2024
-- Python: 3.11.11
-- Stable-Baselines3: 2.6.0a2
 - PyTorch: 2.6.0+cu124
 - GPU Enabled: True
-- Numpy: 1.26.4
 - Cloudpickle: 3.1.1
 - Gymnasium: 1.1.1
 - OpenAI Gym: 0.25.2

+- OS: Linux-6.1.123+-x86_64-with-glibc2.35 # 1 SMP PREEMPT_DYNAMIC Sun Mar 30 16:01:29 UTC 2025
+- Python: 3.11.12
+- Stable-Baselines3: 2.6.0
 - PyTorch: 2.6.0+cu124
 - GPU Enabled: True
+- Numpy: 2.0.2
 - Cloudpickle: 3.1.1
 - Gymnasium: 1.1.1
 - OpenAI Gym: 0.25.2

results.json CHANGED Viewed

	@@ -1 +1 @@
1	- {"mean_reward": ~~268~~.5, "std_reward": 78.~~16808811785025~~, "is_deterministic": false, "n_eval_episodes": 10, "eval_datetime": "2025-03-~~17T08~~:31:32.~~688700~~"}


1	+ {"mean_reward": 691.5, "std_reward": 233.57065312234755, "is_deterministic": false, "n_eval_episodes": 10, "eval_datetime": "2025-05-18T09:56:09.714288"}

train_eval_metrics.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a32cb60e47a7220aee02497f3cfe07f1baf07ac414b9258bb3abc9fd4245771f
-size 5724

 version https://git-lfs.github.com/spec/v1
+oid sha256:cec2b495bda42f9ce1559729e6d3899ba15551f3798ae949a5ae311c3822b137
+size 36185