mojemai
/

a2c-PandaReachDense-v2

Reinforcement Learning

stable-baselines3

PandaReachDense-v2

deep-reinforcement-learning

Eval Results (legacy)

Model card Files Files and versions

mojemai commited on Aug 17, 2023

Commit

062fcd4

·

1 Parent(s): ff7d341

Update README.md

Added link to paper

Files changed (1) hide show

README.md +21 -6

README.md CHANGED Viewed

@@ -25,13 +25,28 @@ model-index:
 This is a trained model of a **A2C** agent playing **PandaReachDense-v2**
 using the [stable-baselines3 library](https://github.com/DLR-RM/stable-baselines3).
-## Usage (with Stable-baselines3)
-TODO: Add your code
-```python
-from stable_baselines3 import ...
-from huggingface_sb3 import load_from_hub
-...
 ```

 This is a trained model of a **A2C** agent playing **PandaReachDense-v2**
 using the [stable-baselines3 library](https://github.com/DLR-RM/stable-baselines3).
+The RL Zoo is a training framework for Stable Baselines3
+reinforcement learning agents,
+with hyperparameter optimization and pre-trained agents included.
+## Usage (with SB3 RL Zoo)
+RL Zoo: https://github.com/DLR-RM/rl-baselines3-zoo<br/>
+SB3: https://github.com/DLR-RM/stable-baselines3<br/>
+SB3 Contrib: https://github.com/Stable-Baselines-Team/stable-baselines3-contrib
 ```
+# Download model and save it into the logs/ folder
+python -m rl_zoo3.load_from_hub --algo tqc --env PandaReachDense-v2 -orga sb3 -f logs/
+python enjoy.py --algo a2c --env PandaReachDense-v2  -f logs/
+```
+## Training (with the RL Zoo)
+```
+python train.py --algo a2c --env PandaReachDense-v2 -f logs/
+# Upload the model and generate video (when possible)
+python -m rl_zoo3.push_to_hub --algo a2c --env PandaReachDense-v2 -f logs/ -orga sb3
+```
+Panda Gym environments: [arxiv.org/abs/2106.13687](https://arxiv.org/abs/2106.13687)