Upload folder using huggingface_hub

Browse files

Files changed (5) hide show

beta/metadata.pt +3 -0
beta/model.safetensors +3 -0
beta/norm_stats.json +82 -0
beta/optimizer.pt +3 -0
beta/train_config.yaml +81 -0

beta/metadata.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:980b85d74b7a4f32d5227b3890e3317f750b9f1c7b255162ac9ed9a72734f88c
+size 1267

beta/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d7c162b14275476cf9cf050c8a88527db1c28bbaa1740aa9b1a307e470ff0bdf
+size 7874279060

beta/norm_stats.json ADDED Viewed

	@@ -0,0 +1,82 @@

+{
+  "state": {
+    "mean": [
+      -0.046521167204962556,
+      0.03440711916118233,
+      0.7645510541638811,
+      2.972206629083346,
+      -0.22048456658605764,
+      -0.12558510205548704,
+      0.026914437835321277,
+      -0.027190919539383258
+    ],
+    "std": [
+      0.10494495178849877,
+      0.15176981509729204,
+      0.3785169899678948,
+      0.34427321172541686,
+      0.9069665667914908,
+      0.3253953728031856,
+      0.014175856715986892,
+      0.014058836306644338
+    ],
+    "q01": [
+      -0.3993664956152439,
+      -0.2691648515164852,
+      0.0380015922319144,
+      1.5083277968406676,
+      -2.7224448468208315,
+      -1.0813218128442763,
+      0.00173520012809895,
+      -0.04005292297729757
+    ],
+    "q99": [
+      0.13545873028039934,
+      0.33551978799700743,
+      1.27041562808156,
+      3.2765059180259706,
+      2.4039963840961454,
+      0.5971528978824616,
+      0.04030334069116507,
+      -0.0017878379381960213
+    ]
+  },
+  "action": {
+    "mean": [
+      0.05515142225915216,
+      0.08769114746846801,
+      -0.08734487482305489,
+      0.0007091030675075027,
+      0.005476403673860704,
+      -0.005540392002278206,
+      -0.04563926272674084
+    ],
+    "std": [
+      0.33186087749168136,
+      0.37579685333032686,
+      0.44811232017091995,
+      0.03933290297384835,
+      0.0635858615556415,
+      0.0785736716640555,
+      0.998957985952242
+    ],
+    "q01": [
+      -0.7072499999999999,
+      -0.7983750000000001,
+      -0.9375,
+      -0.11467779144644738,
+      -0.16395,
+      -0.2240490057706833,
+      -1.0
+    ],
+    "q99": [
+      0.937125,
+      0.86775,
+      0.937125,
+      0.13175314307212832,
+      0.19169999999999998,
+      0.33742949963808055,
+      0.9996
+    ]
+  }
+}

beta/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5d179e5eca17513ddc03dba6628f489498219f3da505017f63f7bfc1899d30b9
+size 2842889522

beta/train_config.yaml ADDED Viewed

	@@ -0,0 +1,81 @@

+runtime:
+  exp_name: beta-0330
+  checkpoint_base_dir: ./checkpoints
+  wandb_project: beta-0330
+  wandb_enabled: true
+  seed: 42
+  batch_size: 16
+  grad_accumulation_steps: 1
+  use_amp: true
+  num_train_steps: 100000
+  log_interval: 20
+  save_interval: 10000
+  learning_rate: 0.0002
+  weight_decay: 0.0001
+  num_workers: 4
+  resume: true
+  resume_from_best: false
+  overwrite: false
+  grad_clip_norm: 1.0
+  warmup_steps: 500
+  lr_schedule: cosine_warmup
+  end_lr: 1.0e-06
+data:
+  repo_id: physical-intelligence/libero
+  split: train
+  num_workers: 4
+  max_token_len: 128
+  max_samples: null
+  state_dim: 8
+  norm_stats_path: assets/physical-intelligence/libero/norm_stats.json
+  temporal_frames: 1
+  temporal_stride: 5
+model:
+  action_dim: 7
+  action_horizon: 10
+  state_dim: 8
+  gripper_loss_weight: 1.0
+  freeze_vision: false
+  freeze_language: false
+  freeze_vggt: false
+  use_lora: true
+  lora_r: 16
+  lora_alpha: 32
+  lora_dropout: 0.05
+  lora_target_modules:
+  - q_proj
+  - k_proj
+  - v_proj
+  - o_proj
+  - up_proj
+  - down_proj
+  - gate_proj
+  lora_target_modules_vggt:
+  - qkv
+  - proj
+  - fc1
+  - fc2
+  lora_on_language: true
+  lora_on_vggt: true
+  lora_on_vision: true
+  lora_target_modules_vision:
+  - q_proj
+  - k_proj
+  - v_proj
+  - out_proj
+  - fc1
+  - fc2
+  vision:
+    model_name: google/paligemma2-3b-pt-224
+    image_size: 224
+  language:
+    model_name: Qwen/Qwen3-0.6B-Base
+    trust_remote_code: true
+  vggt:
+    model_name: facebook/VGGT-1B
+    trust_remote_code: true
+    vision_patch_hw: !!python/tuple
+    - 16
+    - 16
+    num_cameras: 2
+    temporal_frames: 1