Upload folder using huggingface_hub

Browse files

Files changed (9) hide show

.summary/0/events.out.tfevents.1689616460.qgallouedec-MS-7C84 +3 -0
README.md +1 -1
checkpoint_p0/best_000019264_9863168_reward_428.167.pth +3 -0
checkpoint_p0/checkpoint_000019472_9969664.pth +3 -0
checkpoint_p0/checkpoint_000019544_10006528.pth +1 -1
config.json +2 -2
git.diff +149 -91
replay.mp4 +2 -2
sf_log.txt +0 -0

.summary/0/events.out.tfevents.1689616460.qgallouedec-MS-7C84 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c14ac072b47f163b9b40b9943ca0d04070cd968546cfdcd55b958b3c95ec2bce
+size 700314

README.md CHANGED Viewed

@@ -15,7 +15,7 @@ model-index:
       type: bin-picking-v2
     metrics:
     - type: mean_reward
-      value: 61.02 +/- 36.03
       name: mean_reward
       verified: false
 ---

       type: bin-picking-v2
     metrics:
     - type: mean_reward
+      value: 452.37 +/- 36.53
       name: mean_reward
       verified: false
 ---

checkpoint_p0/best_000019264_9863168_reward_428.167.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:79f5623aadf2391036a6b0375de622dcbf299d8bf7f1e8f7a45875552255db93
+size 98239

checkpoint_p0/checkpoint_000019472_9969664.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b5bdba43d6c84fa46e0458b9f3ff3669f02f85381a0208c6f097e08900f02fa2
+size 98567

checkpoint_p0/checkpoint_000019544_10006528.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7e95491e121d7872b3757d667aee9955960d19ada63238ec94b4cade1bc05f64
 size 98567

 version https://git-lfs.github.com/spec/v1
+oid sha256:8e3659821692b5baebd00d6b39e856f2434f8c4c6c796d8da43a5eb80c302359
 size 98567

config.json CHANGED Viewed

@@ -128,7 +128,7 @@
     "wandb_user": "qgallouedec",
     "wandb_project": "sample_facotry_metaworld"
   },
-  "git_hash": "66db1b7a27030aa65fcfa2d6e3503089a7cff207",
   "git_repo_name": "https://github.com/huggingface/gia",
-  "wandb_unique_id": "bin-picking-v2_20230708_124717_514721"
 }

     "wandb_user": "qgallouedec",
     "wandb_project": "sample_facotry_metaworld"
   },
+  "git_hash": "952d4a00946fa97ee3267d32a2160be9933e887a",
   "git_repo_name": "https://github.com/huggingface/gia",
+  "wandb_unique_id": "bin-picking-v2_20230717_195418_651812"
 }

git.diff CHANGED Viewed

@@ -1,3 +1,140 @@
 diff --git a/gia/eval/callback.py b/gia/eval/callback.py
 index 5c3a080..4b6198f 100644
 --- a/gia/eval/callback.py
@@ -14,70 +151,21 @@ index 5c3a080..4b6198f 100644
  from gia.config import Arguments
  from gia.eval.utils import is_slurm_available
-diff --git a/gia/eval/evaluator.py b/gia/eval/evaluator.py
-index 91b645c..3e2cae7 100644
---- a/gia/eval/evaluator.py
-+++ b/gia/eval/evaluator.py
-@@ -1,3 +1,5 @@
-+from typing import Optional
-+
- import torch
- from gia.config.arguments import Arguments
-@@ -5,11 +7,12 @@ from gia.model import GiaModel
- class Evaluator:
--    def __init__(self, args: Arguments, task: str) -> None:
-+    def __init__(self, args: Arguments, task: str, mean_random: Optional[float] = None) -> None:
-         self.args = args
-         self.task = task
-+        self.mean_random = mean_random
--    @torch.no_grad()
-+    @torch.inference_mode()
-     def evaluate(self, model: GiaModel) -> float:
-         return self._evaluate(model)
-diff --git a/gia/eval/rl/envs/core.py b/gia/eval/rl/envs/core.py
-index ec5e5b2..eeaf7cb 100644
---- a/gia/eval/rl/envs/core.py
-+++ b/gia/eval/rl/envs/core.py
-@@ -177,7 +177,6 @@ def make(task_name: str, num_envs: int = 1):
-     elif task_name.startswith("metaworld"):
-         import gymnasium as gym
--        import metaworld
-         env_id = TASK_TO_ENV_MAPPING[task_name]
-         env = gym.vector.SyncVectorEnv([lambda: gym.make(env_id)] * num_envs)
 diff --git a/gia/eval/rl/gia_agent.py b/gia/eval/rl/gia_agent.py
-index f0d0b9b..39dc0d2 100644
 --- a/gia/eval/rl/gia_agent.py
 +++ b/gia/eval/rl/gia_agent.py
-@@ -54,7 +54,7 @@ class GiaAgent:
-         self.action_space = action_space
-         self.deterministic = deterministic
-         self.device = next(model.parameters()).device
--        self._max_length = self.model.config.max_position_embeddings - 10
-+        self._max_length = self.model.config.max_position_embeddings - 100  # TODO: fix this
-         if isinstance(observation_space, spaces.Box):
-             self._observation_key = "continuous_observations"
-@@ -75,6 +75,11 @@ class GiaAgent:
-     ) -> Tuple[Tuple[Tensor, Tensor], ...]:
-         return tuple((k[:, :, -self._max_length :], v[:, :, -self._max_length :]) for (k, v) in past_key_values)
-+    def set_model(self, model: GiaModel) -> None:
-+        self.model = model
-+        self.device = next(model.parameters()).device
-+        self._max_length = self.model.config.max_position_embeddings
-+
-     def reset(self, num_envs: int = 1) -> None:
-         if self.prompter is not None:
-             prompts = self.prompter.generate_prompts(num_envs)
 diff --git a/gia/eval/rl/gym_evaluator.py b/gia/eval/rl/gym_evaluator.py
-index f8531ee..754c05d 100644
 --- a/gia/eval/rl/gym_evaluator.py
 +++ b/gia/eval/rl/gym_evaluator.py
@@ -1,7 +1,7 @@
@@ -85,37 +173,7 @@ index f8531ee..754c05d 100644
  from gym.vector.vector_env import VectorEnv
 -from gia.eval.mappings import TASK_TO_ENV_MAPPING
-+# from gia.eval.rl.envs.mappings import TASK_TO_ENV_MAPPING
  from gia.eval.rl.rl_evaluator import RLEvaluator
-diff --git a/gia/eval/rl/rl_evaluator.py b/gia/eval/rl/rl_evaluator.py
-index c5cc423..91189f3 100644
---- a/gia/eval/rl/rl_evaluator.py
-+++ b/gia/eval/rl/rl_evaluator.py
-@@ -8,6 +8,10 @@ from gia.eval.rl.gia_agent import GiaAgent
- class RLEvaluator(Evaluator):
-+    def __init__(self, args, task):
-+        super().__init__(args, task)
-+        self.agent = GiaAgent()
-+
-     def _build_env(self) -> VectorEnv:  # TODO: maybe just a gym.Env ?
-         raise NotImplementedError
-diff --git a/gia/eval/rl/scores_dict.json b/gia/eval/rl/scores_dict.json
-index 1b8ebee..ff7d030 100644
---- a/gia/eval/rl/scores_dict.json
-+++ b/gia/eval/rl/scores_dict.json
-@@ -929,8 +929,8 @@
-     },
-     "metaworld-assembly": {
-         "expert": {
--            "mean": 311.29314618777823,
--            "std": 75.04282151450695
-+            "mean": 3523.81468486244,
-+            "std": 63.22745220327798
-         },
-         "random": {
-             "mean": 220.65601680730813,

+diff --git a/data/envs/metaworld/generate_dataset_all.sh b/data/envs/metaworld/generate_dataset_all.sh
+index acfe879..0185b2b 100755
+--- a/data/envs/metaworld/generate_dataset_all.sh
++++ b/data/envs/metaworld/generate_dataset_all.sh
+@@ -2,8 +2,6 @@
+ ENVS=(
+     assembly
+-    basketball
+-    bin-picking
+     box-close
+     button-press-topdown
+     button-press-topdown-wall
+@@ -11,9 +9,7 @@ ENVS=(
+     button-press-wall
+     coffee-button
+     coffee-pull
+-    coffee-push
+     dial-turn
+-    disassemble
+     door-close
+     door-lock
+     door-open
+@@ -22,29 +18,15 @@ ENVS=(
+     drawer-open
+     faucet-close
+     faucet-open
+-    hammer
+     hand-insert
+     handle-press-side
+     handle-press
+     handle-pull-side
+     handle-pull
+     lever-pull
+-    peg-insert-side
+-    peg-unplug-side
+-    pick-out-of-hole
+-    pick-place
+-    pick-place-wall
+-    plate-slide-back-side
+-    plate-slide-back
+-    plate-slide-side
+-    plate-slide
+     push-back
+     push
+     push-wall
+-    reach
+-    reach-wall
+-    shelf-place
+-    soccer
+     stick-pull
+     stick-push
+     sweep-into
+@@ -54,6 +36,6 @@ ENVS=(
+ )
+ for ENV in "${ENVS[@]}"; do
+-    python -m sample_factory.huggingface.load_from_hub -r qgallouedec/$ENV-v2
++    # python -m sample_factory.huggingface.load_from_hub -r qgallouedec/$ENV-v2
+     python generate_dataset.py --env $ENV-v2 --experiment $ENV-v2 --train_dir=./train_dir
+ done
+diff --git a/data/envs/metaworld/train_all.sh b/data/envs/metaworld/train_all.sh
+index dbf328a..166ccb8 100755
+--- a/data/envs/metaworld/train_all.sh
++++ b/data/envs/metaworld/train_all.sh
+@@ -1,56 +1,10 @@
+ #!/bin/bash
+ ENVS=(
+-    assembly
+-    basketball
+     bin-picking
+-    box-close
+-    button-press-topdown
+-    button-press-topdown-wall
+-    button-press
+-    button-press-wall
+-    coffee-button
+-    coffee-pull
+-    coffee-push
+-    dial-turn
+     disassemble
+-    door-close
+-    door-lock
+-    door-open
+-    door-unlock
+-    drawer-close
+-    drawer-open
+-    faucet-close
+-    faucet-open
+-    hammer
+-    hand-insert
+-    handle-press-side
+-    handle-press
+-    handle-pull-side
+-    handle-pull
+-    lever-pull
+     peg-insert-side
+-    peg-unplug-side
+-    pick-out-of-hole
+-    pick-place
+     pick-place-wall
+-    plate-slide-back-side
+-    plate-slide-back
+-    plate-slide-side
+-    plate-slide
+-    push-back
+-    push
+-    push-wall
+-    reach
+-    reach-wall
+-    shelf-place
+-    soccer
+-    stick-pull
+-    stick-push
+-    sweep-into
+-    sweep
+-    window-close
+-    window-open
+ )
+ for ENV in "${ENVS[@]}"; do
+diff --git a/data/envs/mujoco/create_mujoco_dataset.sh b/data/envs/mujoco/create_mujoco_dataset.sh
+old mode 100644
+new mode 100755
+index d8ce6d6..c4dfebb
+--- a/data/envs/mujoco/create_mujoco_dataset.sh
++++ b/data/envs/mujoco/create_mujoco_dataset.sh
+@@ -2,7 +2,7 @@
+ # creates 100,000 per environment from models hosted on the hub
+ ENVS=(
+-    ant halfcheetah hopper doublependulum pendulum reacher swimmer walker
++    ant
+ )
+ for ENV in "${ENVS[@]}"; do
 diff --git a/gia/eval/callback.py b/gia/eval/callback.py
 index 5c3a080..4b6198f 100644
 --- a/gia/eval/callback.py
  from gia.config import Arguments
  from gia.eval.utils import is_slurm_available
 diff --git a/gia/eval/rl/gia_agent.py b/gia/eval/rl/gia_agent.py
+index af6d86e..f6098d4 100644
 --- a/gia/eval/rl/gia_agent.py
 +++ b/gia/eval/rl/gia_agent.py
+@@ -94,7 +94,7 @@ class GiaAgent:
+         elif isinstance(self.observation_space, spaces.MultiDiscrete):
+             self._observation_key = "discrete_observations"
+         else:
+-            raise TypeError("Unsupported observation space")
++            print("Unsupported observation space")
+         if isinstance(self.action_space, spaces.Box):
+             self._num_act_tokens = self.action_space.shape[0]
 diff --git a/gia/eval/rl/gym_evaluator.py b/gia/eval/rl/gym_evaluator.py
+index f8531ee..44f5f91 100644
 --- a/gia/eval/rl/gym_evaluator.py
 +++ b/gia/eval/rl/gym_evaluator.py
@@ -1,7 +1,7 @@
  from gym.vector.vector_env import VectorEnv
 -from gia.eval.mappings import TASK_TO_ENV_MAPPING
++# from gia.eval.mappings import TASK_TO_ENV_MAPPING
  from gia.eval.rl.rl_evaluator import RLEvaluator

replay.mp4 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1a58adfe94e40a3beb02b16571030b03760b1defa8c0c4ef9f4e0f20b8c463c3
-size 677382

 version https://git-lfs.github.com/spec/v1
+oid sha256:1b2a99c438b25270b07f006a63f81bb3814b5df728b5146a00b985950e933201
+size 745108

sf_log.txt CHANGED Viewed

The diff for this file is too large to render. See raw diff