Instructions to use lgiraud/PandaReachJointsDense-v3 with libraries, inference providers, notebooks, and local apps. Follow these links to get started.
- Libraries
- stable-baselines3
How to use lgiraud/PandaReachJointsDense-v3 with stable-baselines3:
from huggingface_sb3 import load_from_hub checkpoint = load_from_hub( repo_id="lgiraud/PandaReachJointsDense-v3", filename="{MODEL FILENAME}.zip", ) - Notebooks
- Google Colab
- Kaggle
A2C Agent playing PandaReachJointsDense-v3
Ce modèle a été entraîné avec Stable-Baselines3 pour contrôler un bras robotisé. L'objectif est d'atteindre une cible en 3D en manipulant directement les articulations du robot.
Rendu Vidéo
Détails techniques
- Environnement : PandaReachJointsDense-v3
- Algorithme : A2C (Advantage Actor-Critic)
- Politique :
MultiInputPolicy(indispensable pour les Dict Observation Spaces) - Timesteps : 500 000
- Framework : Stable-Baselines3 v2.x et Gymnasium v0.29+
Suivi de l'expérience
Les courbes d'apprentissage complètes (récompense, perte d'entropie) sont disponibles sur Weights & Biases : MSO-TD1-PANDA sur W&B
- Downloads last month
- 6