Initial commit

Files changed (6) hide show

.gitattributes CHANGED Viewed

@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+replay.mp4 filter=lfs diff=lfs merge=lfs -text

README.md ADDED Viewed

+---
+library_name: stable-baselines3
+tags:
+- PandaReachDense-v3
+- A2C
+- deep-reinforcement-learning
+- reinforcement-learning
+- stable-baselines3
+model-index:
+- name: a2c-PandaReachDense-v3
+  results:
+  - task:
+      type: reinforcement-learning
+      name: reinforcement-learning
+    dataset:
+      name: PandaReachDense-v3
+      type: PandaReachDense-v3
+    metrics:
+    - type: mean_reward
+      value: -0.17 +/- 0.12
+      name: mean_reward
+---
+# a2c-PandaReachDense-v3: **A2C** Agent playing **PandaReachDense-v3**
+This is a trained model of a **A2C** agent playing **PandaReachDense-v3**
+using the [stable-baselines3 library](https://github.com/DLR-RM/stable-baselines3).
+## Usage (with Stable-baselines3)
+TODO: Add your code
+```python
+from stable_baselines3 import ...
+...
+```

a2c-PandaReachDense-v3.zip ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:fb4b29ea78d03d44089fd1fd7edf412c42b6ae900311fd983a2b0801b1dc2970
+size 114363

replay.mp4 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:0671d6c23336525ba662eb02a3fcb809ec88d36a06409e10c4fda7424f1d2578
+size 623635

results.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"mean_reward": -0.17322514443658293, "std_reward": 0.11986290127927479, "is_deterministic": true, "n_eval_episodes": 10, "eval_datetime": "2025-11-19T19:08:38.928173"}

vec_normalize.pkl ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:368eb13e9ad88a2a4e71826a9cc3ab356d66640a903b28d26d5da95f65b3045c
+size 2644