Upload 4 files

Browse files

Files changed (4) hide show

README.md +68 -0
gitattributes +35 -0
metadata.json +7 -0
model.zip +3 -0

README.md ADDED Viewed

	@@ -0,0 +1,68 @@

+---
+tags:
+- deep-reinforcement-learning
+- reinforcement-learning
+- stable-baselines3
+- BipedalWalker-v3
+- PPO
+- SAC
+library_name: stable-baselines3
+model_name: ppo
+---
+# 🤖 PPO/SAC Agent for BipedalWalker-v3
+This is a trained agent that learned to walk on two legs from scratch!
+## Model Description
+- **Algorithm**: PPO or SAC (Soft Actor-Critic)
+- **Environment**: BipedalWalker-v3
+- **Framework**: Stable-Baselines3
+- **Training Steps**: 500,000 steps
+## Performance
+- **Walking Success**: Consistent bipedal locomotion
+- **Average Reward**: 200+ (successful walking)
+- **Coordination**: Learned proper leg coordination and balance
+## Usage
+```python
+from stable_baselines3 import PPO
+import gymnasium as gym
+# Load the trained model
+model = PPO.load("bipedal_walker_ppo_model")
+# Create environment
+env = gym.make('BipedalWalker-v3', render_mode='human')
+# Watch it walk!
+obs, _ = env.reset()
+for _ in range(2000):
+    action, _ = model.predict(obs, deterministic=True)
+    obs, reward, terminated, truncated, info = env.step(action)
+    if terminated or truncated:
+        obs, _ = env.reset()
+env.close()
+```
+## Training Details
+The agent learned to coordinate:
+- 4 continuous joint controls (hip + knee for each leg)
+- Balance and momentum management
+- Forward locomotion
+- Obstacle navigation
+## What Makes This Impressive
+- **24-dimensional state space** - Complex sensory input
+- **Continuous control** - Smooth joint movements
+- **Physics simulation** - Realistic walking dynamics
+- **From scratch learning** - No pre-programmed walking patterns
+Amazing to watch a robot learn to walk! 🚶‍♂️

gitattributes ADDED Viewed

	@@ -0,0 +1,35 @@

+*.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ckpt filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.mlmodel filter=lfs diff=lfs merge=lfs -text
+*.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.npy filter=lfs diff=lfs merge=lfs -text
+*.npz filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pickle filter=lfs diff=lfs merge=lfs -text
+*.pkl filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+*.safetensors filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tar filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.wasm filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zst filter=lfs diff=lfs merge=lfs -text
+*tfevents* filter=lfs diff=lfs merge=lfs -text

metadata.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "algorithm": "PPO",
+  "environment": "BipedalWalker-v3",
+  "framework": "stable-baselines3",
+  "upload_date": "2025-09-20T20:10:01.676730",
+  "description": "Learned bipedal locomotion from scratch"
+}

model.zip ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0c851d12caf37f6c6d2001266e5d6ee9745975bc82435cad6b750573515c5482
+size 3292414