Upload folder using huggingface_hub

Browse files

Files changed (15) hide show

.gitattributes +0 -1
README.md +5 -11
args.yml +4 -6
config.yml +1 -1
dqn-SpaceInvadersNoFrameskip-v4.zip +2 -2
dqn-SpaceInvadersNoFrameskip-v4/_stable_baselines3_version +1 -1
dqn-SpaceInvadersNoFrameskip-v4/data +0 -0
dqn-SpaceInvadersNoFrameskip-v4/policy.optimizer.pth +2 -2
dqn-SpaceInvadersNoFrameskip-v4/policy.pth +2 -2
dqn-SpaceInvadersNoFrameskip-v4/pytorch_variables.pth +2 -2
dqn-SpaceInvadersNoFrameskip-v4/system_info.txt +6 -8
env_kwargs.yml +1 -1
replay.mp4 +3 -0
results.json +1 -1
train_eval_metrics.zip +2 -2

.gitattributes CHANGED Viewed

@@ -25,7 +25,6 @@
 *.safetensors filter=lfs diff=lfs merge=lfs -text
 saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.tar.* filter=lfs diff=lfs merge=lfs -text
-*.tar filter=lfs diff=lfs merge=lfs -text
 *.tflite filter=lfs diff=lfs merge=lfs -text
 *.tgz filter=lfs diff=lfs merge=lfs -text
 *.wasm filter=lfs diff=lfs merge=lfs -text

 *.safetensors filter=lfs diff=lfs merge=lfs -text
 saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.tar.* filter=lfs diff=lfs merge=lfs -text
 *.tflite filter=lfs diff=lfs merge=lfs -text
 *.tgz filter=lfs diff=lfs merge=lfs -text
 *.wasm filter=lfs diff=lfs merge=lfs -text

README.md CHANGED Viewed

@@ -16,7 +16,7 @@ model-index:
       type: SpaceInvadersNoFrameskip-v4
     metrics:
     - type: mean_reward
-      value: 713.50 +/- 96.83
       name: mean_reward
       verified: false
 ---
@@ -35,7 +35,6 @@ with hyperparameter optimization and pre-trained agents included.
 RL Zoo: https://github.com/DLR-RM/rl-baselines3-zoo<br/>
 SB3: https://github.com/DLR-RM/stable-baselines3<br/>
 SB3 Contrib: https://github.com/Stable-Baselines-Team/stable-baselines3-contrib
-SBX (SB3 + Jax): https://github.com/araffin/sbx
 Install the RL Zoo (with SB3 and SB3-Contrib):
 ```bash
@@ -44,13 +43,13 @@ pip install rl_zoo3
 ```
 # Download model and save it into the logs/ folder
-python -m rl_zoo3.load_from_hub --algo dqn --env SpaceInvadersNoFrameskip-v4 -orga Kolosok -f logs/
 python -m rl_zoo3.enjoy --algo dqn --env SpaceInvadersNoFrameskip-v4  -f logs/
 ```
 If you installed the RL Zoo3 via pip (`pip install rl_zoo3`), from anywhere you can do:
 ```
-python -m rl_zoo3.load_from_hub --algo dqn --env SpaceInvadersNoFrameskip-v4 -orga Kolosok -f logs/
 python -m rl_zoo3.enjoy --algo dqn --env SpaceInvadersNoFrameskip-v4  -f logs/
 ```
@@ -58,7 +57,7 @@ python -m rl_zoo3.enjoy --algo dqn --env SpaceInvadersNoFrameskip-v4  -f logs/
 ```
 python -m rl_zoo3.train --algo dqn --env SpaceInvadersNoFrameskip-v4 -f logs/
 # Upload the model and generate video (when possible)
-python -m rl_zoo3.push_to_hub --algo dqn --env SpaceInvadersNoFrameskip-v4 -f logs/ -orga Kolosok
 ```
 ## Hyperparameters
@@ -73,15 +72,10 @@ OrderedDict([('batch_size', 32),
              ('gradient_steps', 1),
              ('learning_rate', 0.0001),
              ('learning_starts', 100000),
-             ('n_timesteps', 1000000.0),
              ('optimize_memory_usage', False),
              ('policy', 'CnnPolicy'),
              ('target_update_interval', 1000),
              ('train_freq', 4),
              ('normalize', False)])
 ```
-# Environment Arguments
-```python
-{'render_mode': 'rgb_array'}
-```

       type: SpaceInvadersNoFrameskip-v4
     metrics:
     - type: mean_reward
+      value: 889.50 +/- 289.46
       name: mean_reward
       verified: false
 ---
 RL Zoo: https://github.com/DLR-RM/rl-baselines3-zoo<br/>
 SB3: https://github.com/DLR-RM/stable-baselines3<br/>
 SB3 Contrib: https://github.com/Stable-Baselines-Team/stable-baselines3-contrib
 Install the RL Zoo (with SB3 and SB3-Contrib):
 ```bash
 ```
 # Download model and save it into the logs/ folder
+python -m rl_zoo3.load_from_hub --algo dqn --env SpaceInvadersNoFrameskip-v4 -orga HaiderAUT -f logs/
 python -m rl_zoo3.enjoy --algo dqn --env SpaceInvadersNoFrameskip-v4  -f logs/
 ```
 If you installed the RL Zoo3 via pip (`pip install rl_zoo3`), from anywhere you can do:
 ```
+python -m rl_zoo3.load_from_hub --algo dqn --env SpaceInvadersNoFrameskip-v4 -orga HaiderAUT -f logs/
 python -m rl_zoo3.enjoy --algo dqn --env SpaceInvadersNoFrameskip-v4  -f logs/
 ```
 ```
 python -m rl_zoo3.train --algo dqn --env SpaceInvadersNoFrameskip-v4 -f logs/
 # Upload the model and generate video (when possible)
+python -m rl_zoo3.push_to_hub --algo dqn --env SpaceInvadersNoFrameskip-v4 -f logs/ -orga HaiderAUT
 ```
 ## Hyperparameters
              ('gradient_steps', 1),
              ('learning_rate', 0.0001),
              ('learning_starts', 100000),
+             ('n_timesteps', 10000000.0),
              ('optimize_memory_usage', False),
              ('policy', 'CnnPolicy'),
              ('target_update_interval', 1000),
              ('train_freq', 4),
              ('normalize', False)])
 ```

args.yml CHANGED Viewed

@@ -2,15 +2,13 @@
 - - - algo
     - dqn
   - - conf_file
-    - dqn.yml
   - - device
     - auto
   - - env
     - SpaceInvadersNoFrameskip-v4
   - - env_kwargs
     - null
-  - - eval_env_kwargs
-    - null
   - - eval_episodes
     - 5
   - - eval_freq
@@ -56,7 +54,7 @@
   - - save_replay_buffer
     - false
   - - seed
-    - 381900577
   - - storage
     - null
   - - study_name
@@ -67,8 +65,6 @@
     - false
   - - trained_agent
     - ''
-  - - trial_id
-    - null
   - - truncate_last_trajectory
     - true
   - - uuid
@@ -83,3 +79,5 @@
     - sb3
   - - wandb_tags
     - []

 - - - algo
     - dqn
   - - conf_file
+    - null
   - - device
     - auto
   - - env
     - SpaceInvadersNoFrameskip-v4
   - - env_kwargs
     - null
   - - eval_episodes
     - 5
   - - eval_freq
   - - save_replay_buffer
     - false
   - - seed
+    - 2243915477
   - - storage
     - null
   - - study_name
     - false
   - - trained_agent
     - ''
   - - truncate_last_trajectory
     - true
   - - uuid
     - sb3
   - - wandb_tags
     - []
+  - - yaml_file
+    - null

config.yml CHANGED Viewed

@@ -18,7 +18,7 @@
   - - learning_starts
     - 100000
   - - n_timesteps
-    - 1000000.0
   - - optimize_memory_usage
     - false
   - - policy

   - - learning_starts
     - 100000
   - - n_timesteps
+    - 10000000.0
   - - optimize_memory_usage
     - false
   - - policy

dqn-SpaceInvadersNoFrameskip-v4.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f19ccbc80cb66b553a31d2a9002979b6a26b042528dd4c29fbe45c099a632b7d
-size 27219597

 version https://git-lfs.github.com/spec/v1
+oid sha256:c706d585845776535bada5f6b6c6753dfb610b1bc3d15bb1c13e967b1f00bd0c
+size 27225013

dqn-SpaceInvadersNoFrameskip-v4/_stable_baselines3_version CHANGED Viewed

	@@ -1 +1 @@
1	- 2.7.0


1	+ 1.8.0a2

dqn-SpaceInvadersNoFrameskip-v4/data CHANGED Viewed

The diff for this file is too large to render. See raw diff

dqn-SpaceInvadersNoFrameskip-v4/policy.optimizer.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0af50457e5905a4c41e80a1f79a6714359b5a6a8928a5473cbeef81e03dec23c
-size 13506569

 version https://git-lfs.github.com/spec/v1
+oid sha256:6e47ab09ab431c14712f926a60c2bc21578b6e870c7ac2074cd22997ff9e2fd6
+size 13505739

dqn-SpaceInvadersNoFrameskip-v4/policy.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:84dc331d0e18ccb562ff95fc23280a9bb6e7398b33cb0cc551bb53d1fd073dc5
-size 13505767

 version https://git-lfs.github.com/spec/v1
+oid sha256:0bd94d828fe365b570bcccf70f03facd27714afdc63d90a3ebe8de184491ebb2
+size 13504937

dqn-SpaceInvadersNoFrameskip-v4/pytorch_variables.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:07c7431cf6005e7d8f367d79e995f63e2f9b981a37e3437b795d058f9af4308b
-size 1261

 version https://git-lfs.github.com/spec/v1
+oid sha256:d030ad8db708280fcae77d87e973102039acd23a11bdecc3db8eb6c0ac940ee1
+size 431

dqn-SpaceInvadersNoFrameskip-v4/system_info.txt CHANGED Viewed

@@ -1,9 +1,7 @@
-- OS: Linux-6.6.105+-x86_64-with-glibc2.35 # 1 SMP Thu Oct  2 10:42:05 UTC 2025
-- Python: 3.12.12
-- Stable-Baselines3: 2.7.0
-- PyTorch: 2.8.0+cu126
 - GPU Enabled: True
-- Numpy: 2.0.2
-- Cloudpickle: 3.1.1
-- Gymnasium: 1.2.1
-- OpenAI Gym: 0.25.2

+- OS: Linux-5.10.16.3-microsoft-standard-WSL2-x86_64-with-glibc2.35 # 1 SMP Fri Apr 2 22:23:49 UTC 2021
+- Python: 3.10.9
+- Stable-Baselines3: 1.8.0a2
+- PyTorch: 1.13.1+cu117
 - GPU Enabled: True
+- Numpy: 1.23.5
+- Gym: 0.21.0

env_kwargs.yml CHANGED Viewed

	@@ -1 +1 @@
1	- ~~render_mode: rgb_array~~


1	+ {}

replay.mp4 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:21ccb65236a5ee88da2137e25b6cc987c96a8e733ede307a5b0a966ec0506b2d
+size 171038

results.json CHANGED Viewed

	@@ -1 +1 @@
1	- {"mean_reward": ~~713~~.5, "std_reward": 96.~~82587464102764~~, "is_deterministic": false, "n_eval_episodes": 10, "eval_datetime": "~~2025~~-10-~~15T11~~:24:26.~~433149~~"}


1	+ {"mean_reward": 889.5, "std_reward": 289.4602736128051, "is_deterministic": false, "n_eval_episodes": 10, "eval_datetime": "2023-03-01T11:15:20.817406"}

train_eval_metrics.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d9cff95733983b1ee63368d93b9973880c7c408c0fc4bf47eadc8f6d95c6e3a1
-size 36876

 version https://git-lfs.github.com/spec/v1
+oid sha256:420fa535f2be84f821d3163b122aada33786f8068ec431d781c2d446f06568b5
+size 270929