ChihHanShen commited on Mar 16

Commit

a52f7a6

verified ·

1 Parent(s): 492e99f

Upload folder using huggingface_hub

Browse files

Files changed (20) hide show

.gitattributes +1 -0
checkpoints/finetune_task48_2000step/checkpoints/steps_1000_pytorch_model.pt +3 -0
checkpoints/finetune_task48_2000step/checkpoints/steps_1500_pytorch_model.pt +3 -0
checkpoints/finetune_task48_2000step/checkpoints/steps_2000_pytorch_model.pt +3 -0
checkpoints/finetune_task48_2000step/checkpoints/steps_500_pytorch_model.pt +3 -0
checkpoints/finetune_task48_2000step/config.yaml +48 -0
checkpoints/finetune_task48_2000step/dataset_statistics.json +133 -0
checkpoints/finetune_task48_2000step/final_model/pytorch_model.pt +3 -0
checkpoints/finetune_task48_2000step/summary.jsonl +4 -0
checkpoints/finetune_task48_2000step/wandb/wandb/debug-internal.log +12 -0
checkpoints/finetune_task48_2000step/wandb/wandb/debug.log +0 -0
checkpoints/finetune_task48_2000step/wandb/wandb/run-20260316_102706-w0ljmpp2/files/config.yaml +73 -0
checkpoints/finetune_task48_2000step/wandb/wandb/run-20260316_102706-w0ljmpp2/files/output.log +234 -0
checkpoints/finetune_task48_2000step/wandb/wandb/run-20260316_102706-w0ljmpp2/files/requirements.txt +190 -0
checkpoints/finetune_task48_2000step/wandb/wandb/run-20260316_102706-w0ljmpp2/files/wandb-metadata.json +48 -0
checkpoints/finetune_task48_2000step/wandb/wandb/run-20260316_102706-w0ljmpp2/files/wandb-summary.json +1 -0
checkpoints/finetune_task48_2000step/wandb/wandb/run-20260316_102706-w0ljmpp2/logs/debug-core.log +19 -0
checkpoints/finetune_task48_2000step/wandb/wandb/run-20260316_102706-w0ljmpp2/logs/debug-internal.log +12 -0
checkpoints/finetune_task48_2000step/wandb/wandb/run-20260316_102706-w0ljmpp2/logs/debug.log +0 -0
checkpoints/finetune_task48_2000step/wandb/wandb/run-20260316_102706-w0ljmpp2/run-w0ljmpp2.wandb +3 -0

.gitattributes CHANGED Viewed

@@ -38,3 +38,4 @@ checkpoints/wandb/wandb/run-20260316_085932-77uivys0/run-77uivys0.wandb filter=l
 checkpoints/pretrained_goal_2000step/wandb/wandb/run-20260316_073559-h1hybozy/run-h1hybozy.wandb filter=lfs diff=lfs merge=lfs -text
 checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085932-77uivys0/run-77uivys0.wandb filter=lfs diff=lfs merge=lfs -text
 checkpoints/finetune_task33_2000step/wandb/wandb/run-20260316_092332-e1rd7b68/run-e1rd7b68.wandb filter=lfs diff=lfs merge=lfs -text

 checkpoints/pretrained_goal_2000step/wandb/wandb/run-20260316_073559-h1hybozy/run-h1hybozy.wandb filter=lfs diff=lfs merge=lfs -text
 checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085932-77uivys0/run-77uivys0.wandb filter=lfs diff=lfs merge=lfs -text
 checkpoints/finetune_task33_2000step/wandb/wandb/run-20260316_092332-e1rd7b68/run-e1rd7b68.wandb filter=lfs diff=lfs merge=lfs -text
+checkpoints/finetune_task48_2000step/wandb/wandb/run-20260316_102706-w0ljmpp2/run-w0ljmpp2.wandb filter=lfs diff=lfs merge=lfs -text

checkpoints/finetune_task48_2000step/checkpoints/steps_1000_pytorch_model.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:19f6c920dede8cff547f3face56e4946aeb0e1e0f6a452f78091508095362565
+size 8146438221

checkpoints/finetune_task48_2000step/checkpoints/steps_1500_pytorch_model.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0a3274bfec6045a79745cf1f8797c75df703ae2416caec64b5ebfa4afe5db9be
+size 8146438221

checkpoints/finetune_task48_2000step/checkpoints/steps_2000_pytorch_model.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:81fb4977e54cbfba7e68e872b6b496d08e40a4fc433e5182fc3fadc8b5ef8eae
+size 8146438221

checkpoints/finetune_task48_2000step/checkpoints/steps_500_pytorch_model.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:879914e55b87d2586b1a0581363bfd875007ad40a30ed8a9a99fe29f4d9958a6
+size 8146437392

checkpoints/finetune_task48_2000step/config.yaml ADDED Viewed

	@@ -0,0 +1,48 @@

+datasets:
+  vla_data:
+    CoT_prompt: Your task is {instruction}. To identify the key objects for your task.
+      Locate their bounding boxes in [x1,y1,x2,y2] format.
+    data_mix: libero_90_task_48
+    data_root_dir: playground/Datasets/LEROBOT_LIBERO_DATA
+    dataset_py: lerobot_datasets
+    per_device_batch_size: 1
+    sequential_step_sampling: false
+    video_backend: torchvision_av
+framework:
+  action_model:
+    action_dim: 7
+    future_action_window_size: 7
+    past_action_window_size: 0
+  name: QwenFast
+  qwenvl:
+    base_vlm: playground/Pretrained_models/Qwen2.5-VL-3B-Instruct-Action
+output_dir: ./results/Checkpoints/finetune_task48_2000step
+run_id: finetune_task48_2000step
+run_root_dir: ./results/Checkpoints
+seed: 42
+trainer:
+  eval_interval: 100
+  freeze_modules: qwen_vl_interface.model.model.visual,dino_encoder
+  gradient_accumulation_steps: 1
+  gradient_clipping: 1.0
+  is_resume: true
+  learning_rate:
+    action_model: 0.0001
+    base: 2.5e-05
+    qwen_vl_interface: 1.0e-05
+  logging_frequency: 100
+  lr_scheduler_type: cosine_with_min_lr
+  max_train_steps: 2000
+  num_warmup_steps: 5000
+  optimizer:
+    betas:
+    - 0.9
+    - 0.95
+    eps: 1.0e-08
+    weight_decay: 1.0e-08
+  pretrained_checkpoint: /content/starVLA_r/results/Checkpoints/Qwen2.5-VL-FAST-LIBERO-4in1/checkpoints/steps_30000_pytorch_model.pt
+  save_interval: 500
+  scheduler_specific_kwargs:
+    min_lr: 1.0e-06
+wandb_entity: michellelin9102-usc
+wandb_project: starVLA_Libero

checkpoints/finetune_task48_2000step/dataset_statistics.json ADDED Viewed

	@@ -0,0 +1,133 @@

+{
+  "franka": {
+    "action": {
+      "mean": [
+        0.04281630367040634,
+        0.16635118424892426,
+        -0.10021582990884781,
+        0.0008796637994237244,
+        0.009483124129474163,
+        -0.0018370545003563166,
+        0.48476770520210266
+      ],
+      "std": [
+        0.23814928531646729,
+        0.48973721265792847,
+        0.4945138692855835,
+        0.03829231485724449,
+        0.048698168247938156,
+        0.031572677195072174,
+        0.4997621178627014
+      ],
+      "max": [
+        0.8142856955528259,
+        0.9375,
+        0.9375,
+        0.1971428543329239,
+        0.3385714292526245,
+        0.1703571379184723,
+        1.0
+      ],
+      "min": [
+        -0.7392857074737549,
+        -0.9375,
+        -0.9375,
+        -0.17571428418159485,
+        -0.21642857789993286,
+        -0.2442857176065445,
+        0.0
+      ],
+      "q01": [
+        -0.5450624823570251,
+        -0.8571428656578064,
+        -0.9375,
+        -0.10607142746448517,
+        -0.11142857372760773,
+        -0.09857142716646194,
+        0.0
+      ],
+      "q99": [
+        0.6401785612106323,
+        0.9375,
+        0.9375,
+        0.11249999701976776,
+        0.1633823961019516,
+        0.0798109620809555,
+        1.0
+      ],
+      "mask": [
+        true,
+        true,
+        true,
+        true,
+        true,
+        true,
+        false
+      ]
+    },
+    "state": {
+      "mean": [
+        -0.0446692518889904,
+        -0.009891818277537823,
+        0.5988359451293945,
+        3.129826545715332,
+        -0.04531480744481087,
+        -0.08344470709562302,
+        0.03376416116952896,
+        -0.03510740399360657
+      ],
+      "std": [
+        0.03938385099172592,
+        0.15407362580299377,
+        0.07102718949317932,
+        0.057501792907714844,
+        0.13009506464004517,
+        0.13546207547187805,
+        0.005857877433300018,
+        0.005015654023736715
+      ],
+      "max": [
+        0.08624760061502457,
+        0.32907697558403015,
+        0.7157319784164429,
+        3.3233284950256348,
+        0.5133177638053894,
+        0.3517029881477356,
+        0.04034854471683502,
+        -0.017706822603940964
+      ],
+      "min": [
+        -0.13770002126693726,
+        -0.1906675398349762,
+        0.47950780391693115,
+        2.9164979457855225,
+        -0.6462156176567078,
+        -0.6787144541740417,
+        0.013480174355208874,
+        -0.041075896471738815
+      ],
+      "q01": [
+        -0.12296133488416672,
+        -0.18305309116840363,
+        0.48121508955955505,
+        2.990795373916626,
+        -0.438663512468338,
+        -0.45049262046813965,
+        0.017378225922584534,
+        -0.04001536965370178
+      ],
+      "q99": [
+        0.0570642463862896,
+        0.2863735556602478,
+        0.6942169070243835,
+        3.2584145069122314,
+        0.28781232237815857,
+        0.28255322575569153,
+        0.039883945137262344,
+        -0.01976053975522518
+      ]
+    },
+    "num_transitions": 5252,
+    "num_trajectories": 44
+  }
+}

checkpoints/finetune_task48_2000step/final_model/pytorch_model.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4f765bd031428635d4adc7c885f0434fa5c853d7ec429e36e4e81039919d80dc
+size 8146425390

checkpoints/finetune_task48_2000step/summary.jsonl ADDED Viewed

	@@ -0,0 +1,4 @@

+{"steps": 500}
+{"steps": 1000}
+{"steps": 1500}
+{"steps": 2000}

checkpoints/finetune_task48_2000step/wandb/wandb/debug-internal.log ADDED Viewed

	@@ -0,0 +1,12 @@

+{"time":"2026-03-16T10:27:07.464425119Z","level":"INFO","msg":"stream: starting","core version":"0.24.2"}
+{"time":"2026-03-16T10:27:07.83079351Z","level":"INFO","msg":"stream: created new stream","id":"w0ljmpp2"}
+{"time":"2026-03-16T10:27:07.833232151Z","level":"INFO","msg":"handler: started","stream_id":"w0ljmpp2"}
+{"time":"2026-03-16T10:27:07.833403373Z","level":"INFO","msg":"stream: started","id":"w0ljmpp2"}
+{"time":"2026-03-16T10:27:07.833477504Z","level":"INFO","msg":"writer: started","stream_id":"w0ljmpp2"}
+{"time":"2026-03-16T10:27:07.833576847Z","level":"INFO","msg":"sender: started","stream_id":"w0ljmpp2"}
+{"time":"2026-03-16T10:50:35.313300483Z","level":"INFO","msg":"fileTransfer: Close: file transfer manager closed"}
+{"time":"2026-03-16T10:50:35.636464134Z","level":"INFO","msg":"handler: operation stats","stats":{}}
+{"time":"2026-03-16T10:50:35.641152876Z","level":"INFO","msg":"stream: closing","id":"w0ljmpp2"}
+{"time":"2026-03-16T10:50:35.641183005Z","level":"INFO","msg":"handler: closed","stream_id":"w0ljmpp2"}
+{"time":"2026-03-16T10:50:35.641292294Z","level":"INFO","msg":"sender: closed","stream_id":"w0ljmpp2"}
+{"time":"2026-03-16T10:50:35.641305178Z","level":"INFO","msg":"stream: closed","id":"w0ljmpp2"}

checkpoints/finetune_task48_2000step/wandb/wandb/debug.log ADDED Viewed

File without changes

checkpoints/finetune_task48_2000step/wandb/wandb/run-20260316_102706-w0ljmpp2/files/config.yaml ADDED Viewed

	@@ -0,0 +1,73 @@

+_wandb:
+    value:
+        cli_version: 0.24.2
+        e:
+            xjkqn2u8dse3qnn37usztgd1uc0n91bo:
+                args:
+                    - --config_yaml
+                    - ./examples/LIBERO/train_files/my_libero_finetune.yaml
+                    - --datasets.vla_data.data_mix
+                    - libero_90_task_48
+                    - --run_id
+                    - finetune_task48_2000step
+                codePath: starVLA/training/train_starvla.py
+                codePathLocal: starVLA/training/train_starvla.py
+                cpu_count: 6
+                cpu_count_logical: 12
+                cudaVersion: "13.0"
+                disk:
+                    /:
+                        total: "253055008768"
+                        used: "155059826688"
+                email: chihhans@usc.edu
+                executable: /usr/local/envs/starvla/bin/python3.10
+                git:
+                    commit: e952c81219e9fac2c3183a27cd378e592c4c9ef0
+                    remote: https://github.com/tliao730/starVLA_r
+                gpu: NVIDIA A100-SXM4-80GB
+                gpu_count: 1
+                gpu_nvidia:
+                    - architecture: Ampere
+                      cudaCores: 6912
+                      memoryTotal: "85899345920"
+                      name: NVIDIA A100-SXM4-80GB
+                      uuid: GPU-1000e8c7-f9d7-74b0-8fdb-aad3f6d24e69
+                host: c89e62d63bf0
+                memory:
+                    total: "179370471424"
+                os: Linux-6.6.113+-x86_64-with-glibc2.35
+                program: /content/starVLA_r/starVLA/training/train_starvla.py
+                python: CPython 3.10.20
+                root: ./results/Checkpoints/finetune_task48_2000step/wandb
+                startedAt: "2026-03-16T10:27:06.946692Z"
+                writerId: xjkqn2u8dse3qnn37usztgd1uc0n91bo
+        m: []
+        python_version: 3.10.20
+        t:
+            "1":
+                - 1
+                - 11
+                - 41
+                - 49
+                - 63
+                - 71
+                - 80
+                - 83
+            "2":
+                - 1
+                - 11
+                - 41
+                - 49
+                - 63
+                - 71
+                - 80
+                - 83
+            "3":
+                - 2
+                - 13
+                - 61
+            "4": 3.10.20
+            "5": 0.24.2
+            "6": 4.57.0
+            "12": 0.24.2
+            "13": linux-x86_64

checkpoints/finetune_task48_2000step/wandb/wandb/run-20260316_102706-w0ljmpp2/files/output.log ADDED Viewed

	@@ -0,0 +1,234 @@

+03/16 [10:27:08] INFO     | >> [RANK 0] ***** Training      train_starvla.py:326
+                          Configuration *****
+                 INFO     | >> [RANK 0]   Total             train_starvla.py:327
+                          optimization steps = 2000
+                 INFO     | >> [RANK 0]   Per device batch  train_starvla.py:328
+                          size = 1
+                 INFO     | >> [RANK 0]   Gradient          train_starvla.py:329
+                          accumulation steps = 1
+                 INFO     | >> [RANK 0]   Total batch size  train_starvla.py:330
+                          = 1
+ 20%|██        | 400/2000 [04:19<16:53,  1.58it/s, data_times=0.002, model_times=0.628]
+03/16 [10:28:15] INFO     | >> [RANK 0] Step 100, Loss:     train_starvla.py:242
+                          {'action_dit_loss':
+                          9.314701080322266, 'mse_score':
+                          np.float64(0.034079255802760465),
+                          'data_time':
+                          0.0013499019987648353,
+                          'model_time': 0.635298358,
+                          'learning_rate':
+                          2.0000000000000002e-07, 'epoch':
+                          0.02})
+03/16 [10:29:19] INFO     | >> [RANK 0] Step 200, Loss:     train_starvla.py:242
+                          {'action_dit_loss':
+                          7.929775714874268, 'mse_score':
+                          np.float64(0.03428953959591426),
+                          'data_time':
+                          0.0005867119998583803,
+                          'model_time': 0.6362442019999435,
+                          'learning_rate':
+                          4.0000000000000003e-07, 'epoch':
+                          0.04})
+03/16 [10:30:24] INFO     | >> [RANK 0] Step 300, Loss:     train_starvla.py:242
+                          {'action_dit_loss':
+                          4.264825344085693, 'mse_score':
+                          np.float64(0.036809627059651094),
+                          'data_time':
+                          0.0006798820013500517,
+                          'model_time': 0.6313770140004635,
+                          'learning_rate':
+                          6.000000000000001e-07, 'epoch':
+                          0.06})
+03/16 [10:31:28] INFO     | >> [RANK 0] Step 400, Loss:     train_starvla.py:242
+                          {'action_dit_loss':
+                          5.90472936630249, 'mse_score':
+                          np.float64(0.028770231955113468),
+                          'data_time':
+                          0.0018893399992521154,
+                          'model_time': 0.6276594850005495,
+                          'learning_rate':
+                          8.000000000000001e-07, 'epoch':
+                          0.08})
+03/16 [10:32:32] INFO     | >> [RANK 0] Step 500, Loss:     train_starvla.py:242
+                          {'action_dit_loss':
+                          4.008138656616211, 'mse_score':
+                          np.float64(0.021432459692567525),
+                          'data_time':
+                          0.0005417720003606519,
+                          'model_time': 0.6293254800002615,
+                          'learning_rate':
+                          1.0000000000000002e-06, 'epoch':
+                          0.1})
+✅ Checkpoint saved at ./results/Checkpoints/finetune_task48_2000step/checkpoints/steps_500
+03/16 [10:32:53] INFO     | >> [RANK 0] 📊 Saving accessed  train_starvla.py:229
+                          configuration...
+                 INFO     | >> [RANK 0] ✅ Configuration    train_starvla.py:232
+                          files saved
+03/16 [10:33:58] INFO     | >> [RANK 0] Step 600, Loss:     train_starvla.py:242
+                          {'action_dit_loss':
+                          2.6089346408843994, 'mse_score':
+                          np.float64(0.018183997162692193),
+                          'data_time':
+                          0.0017828830004873453,
+                          'model_time': 0.6282775969993963,
+                          'learning_rate':
+                          1.2000000000000002e-06, 'epoch':
+                          0.11})
+03/16 [10:35:03] INFO     | >> [RANK 0] Step 700, Loss:     train_starvla.py:242
+                          {'action_dit_loss':
+                          2.386871814727783, 'mse_score':
+                          np.float64(0.02084296110337058),
+                          'data_time':
+                          0.0006294380000326782,
+                          'model_time': 0.6310159410004417,
+                          'learning_rate':
+                          1.4000000000000001e-06, 'epoch':
+                          0.13})
+03/16 [10:36:07] INFO     | >> [RANK 0] Step 800, Loss:     train_starvla.py:242
+                          {'action_dit_loss':
+                          2.1533708572387695, 'mse_score':
+                          np.float64(0.02266200388939163),
+                          'data_time':
+                          0.0002977069998451043,
+                          'model_time': 0.6323083229999611,
+                          'learning_rate':
+                          1.6000000000000001e-06, 'epoch':
+                          0.15})
+03/16 [10:37:12] INFO     | >> [RANK 0] Step 900, Loss:     train_starvla.py:242
+                          {'action_dit_loss':
+                          3.9568512439727783, 'mse_score':
+                          np.float64(0.010319906140672347),
+                          'data_time':
+                          0.00023809100093785673,
+                          'model_time': 0.6301700330004678,
+                          'learning_rate':
+                          1.8000000000000001e-06, 'epoch':
+                          0.17})
+03/16 [10:38:16] INFO     | >> [RANK 0] Step 1000, Loss:    train_starvla.py:242
+                          {'action_dit_loss':
+                          2.959420680999756, 'mse_score':
+                          np.float64(0.018102484443056295),
+                          'data_time':
+                          0.002947425999082043,
+                          'model_time': 0.6312376300011238,
+                          'learning_rate':
+                          2.0000000000000003e-06, 'epoch':
+                          0.19})
+✅ Checkpoint saved at ./results/Checkpoints/finetune_task48_2000step/checkpoints/steps_1000
+03/16 [10:38:37] INFO     | >> [RANK 0] 📊 Saving accessed  train_starvla.py:229
+                          configuration...
+                 INFO     | >> [RANK 0] ✅ Configuration    train_starvla.py:232
+                          files saved
+03/16 [10:39:43] INFO     | >> [RANK 0] Step 1100, Loss:    train_starvla.py:242
+                          {'action_dit_loss':
+                          2.4097423553466797, 'mse_score':
+                          np.float64(0.010958415389495369),
+                          'data_time':
+                          0.0004303599998820573,
+                          'model_time': 0.629223395999361,
+                          'learning_rate': 2.2e-06,
+                          'epoch': 0.21})
+03/16 [10:40:47] INFO     | >> [RANK 0] Step 1200, Loss:    train_starvla.py:242
+                          {'action_dit_loss':
+                          1.8001140356063843, 'mse_score':
+                          np.float64(0.016425216646615573),
+                          'data_time':
+                          0.0017891709994728444,
+                          'model_time': 0.6432768380000198,
+                          'learning_rate':
+                          2.4000000000000003e-06, 'epoch':
+                          0.23})
+03/16 [10:41:52] INFO     | >> [RANK 0] Step 1300, Loss:    train_starvla.py:242
+                          {'action_dit_loss':
+                          2.450651168823242, 'mse_score':
+                          np.float64(0.03609608879081504),
+                          'data_time':
+                          0.0006008899999869755,
+                          'model_time': 0.6404236750004202,
+                          'learning_rate': 2.6e-06,
+                          'epoch': 0.25})
+03/16 [10:42:57] INFO     | >> [RANK 0] Step 1400, Loss:    train_starvla.py:242
+                          {'action_dit_loss':
+                          1.3520110845565796, 'mse_score':
+                          np.float64(0.015366809051465815),
+                          'data_time':
+                          0.0019384579991310602,
+                          'model_time': 0.6324510970007395,
+                          'learning_rate':
+                          2.8000000000000003e-06, 'epoch':
+                          0.27})
+03/16 [10:44:02] INFO     | >> [RANK 0] Step 1500, Loss:    train_starvla.py:242
+                          {'action_dit_loss':
+                          1.9549362659454346, 'mse_score':
+                          np.float64(0.027217211106191984),
+                          'data_time':
+                          0.000567299997783266,
+                          'model_time': 0.633298984997964,
+                          'learning_rate': 3e-06, 'epoch':
+                          0.29})
+✅ Checkpoint saved at ./results/Checkpoints/finetune_task48_2000step/checkpoints/steps_1500
+03/16 [10:44:27] INFO     | >> [RANK 0] 📊 Saving accessed  train_starvla.py:229
+                          configuration...
+                 INFO     | >> [RANK 0] ✅ Configuration    train_starvla.py:232
+                          files saved
+03/16 [10:45:32] INFO     | >> [RANK 0] Step 1600, Loss:    train_starvla.py:242
+                          {'action_dit_loss':
+                          4.203729152679443, 'mse_score':
+                          np.float64(0.029437476644757394),
+                          'data_time':
+                          0.002075060001516249,
+                          'model_time': 0.633118129997456,
+                          'learning_rate':
+                          3.2000000000000003e-06, 'epoch':
+                          0.3})
+03/16 [10:46:36] INFO     | >> [RANK 0] Step 1700, Loss:    train_starvla.py:242
+                          {'action_dit_loss':
+                          3.06008243560791, 'mse_score':
+                          np.float64(0.018865567485130245),
+                          'data_time':
+                          0.0007922959994175471,
+                          'model_time': 0.6446109249991423,
+                          'learning_rate':
+                          3.4000000000000005e-06, 'epoch':
+                          0.32})
+03/16 [10:47:41] INFO     | >> [RANK 0] Step 1800, Loss:    train_starvla.py:242
+                          {'action_dit_loss':
+                          1.5572900772094727, 'mse_score':
+                          np.float64(0.03312688171523522),
+                          'data_time':
+                          0.0018809510002029128,
+                          'model_time': 0.6576305890012009,
+                          'learning_rate':
+                          3.6000000000000003e-06, 'epoch':
+                          0.34})
+Error decoding tokens: cannot reshape array of size 55 into shape (7)
+Tokens: [266, 393, 272, 610, 1589, 277, 290, 310, 425, 1084, 261, 256]
+03/16 [10:48:46] INFO     | >> [RANK 0] Step 1900, Loss:    train_starvla.py:242
+                          {'action_dit_loss':
+                          3.1513538360595703, 'mse_score':
+                          np.float64(0.06123608522253369),
+                          'data_time':
+                          0.0007130379999580327,
+                          'model_time': 0.6419669289971353,
+                          'learning_rate':
+                          3.8000000000000005e-06, 'epoch':
+                          0.36})
+03/16 [10:49:50] INFO     | >> [RANK 0] Step 2000, Loss:    train_starvla.py:242
+                          {'action_dit_loss':
+                          1.4614311456680298, 'mse_score':
+                          np.float64(0.018765023958714284),
+                          'data_time':
+                          0.002591219999885652,
+                          'model_time': 0.631486190999567,
+                          'learning_rate':
+                          4.000000000000001e-06, 'epoch':
+                          0.38})
+✅ Checkpoint saved at ./results/Checkpoints/finetune_task48_2000step/checkpoints/steps_2000
+03/16 [10:50:11] INFO     | >> [RANK 0] 📊 Saving accessed  train_starvla.py:229
+                          configuration...
+                 INFO     | >> [RANK 0] ✅ Configuration    train_starvla.py:232
+                          files saved
+03/16 [10:50:33] INFO     | >> [RANK 0] Training complete.  train_starvla.py:369
+                          Final model saved at
+                          ./results/Checkpoints/finetune_ta
+                          sk48_2000step/final_model

checkpoints/finetune_task48_2000step/wandb/wandb/run-20260316_102706-w0ljmpp2/files/requirements.txt ADDED Viewed

	@@ -0,0 +1,190 @@

+starVLA==1.0.1
+grpcio==1.78.0
+albucore==0.0.17
+qwen-vl-utils==0.0.14
+GitPython==3.1.46
+huggingface-hub==0.35.3
+transformers-stream-generator==0.0.4
+httpcore==1.0.9
+einops==0.8.2
+mpmath==1.3.0
+accelerate==1.13.0
+nvidia-cusparselt-cu12==0.7.1
+psutil==7.2.2
+tabulate==0.10.0
+nvidia-cudnn-cu12==9.1.0.70
+safetensors==0.7.0
+draccus==0.10.0
+typing_extensions==4.15.0
+xxhash==3.6.0
+nvidia-nccl-cu12==2.21.5
+hf-xet==1.4.2
+python-dateutil==2.9.0.post0
+wheel==0.46.3
+propcache==0.4.1
+orderly-set==5.5.0
+Werkzeug==3.1.6
+hjson==3.1.0
+sentry-sdk==2.54.0
+yarl==1.23.0
+frozenlist==1.8.0
+nvidia-nvjitlink-cu12==12.4.127
+click==8.3.1
+multidict==6.7.1
+tifffile==2025.5.10
+rerun-sdk==0.26.2
+pydantic_core==2.41.5
+websocket==0.2.1
+zope.event==6.1
+nvidia-cusolver-cu12==11.6.1.9
+pandas==2.3.3
+cloudpickle==3.1.2
+greenlet==3.3.2
+pyserial==3.5
+packaging==25.0
+antlr4-python3-runtime==4.9.3
+nvidia-cufile-cu12==1.13.1.3
+nvidia-cublas-cu12==12.4.5.8
+py-cpuinfo==9.0.0
+typeguard==4.5.1
+pytz==2026.1.post1
+PyYAML==6.0.3
+pillow==12.1.1
+requests==2.32.5
+prompt_toolkit==3.0.52
+setuptools==80.10.2
+nvidia-cuda-cupti-cu12==12.4.127
+importlib_metadata==8.7.1
+diffusers==0.35.2
+torchvision==0.20.1+cu124
+async-timeout==5.0.1
+platformdirs==4.9.4
+idna==3.11
+scikit-image==0.25.2
+eval_type_backport==0.3.1
+pyparsing==3.3.2
+eva-decord==0.6.1
+mergedeep==1.3.4
+yacs==0.1.8
+urllib3==2.6.3
+cuda-pathfinder==1.4.2
+nvidia-cufft-cu12==11.2.1.3
+anyio==4.12.1
+charset-normalizer==3.4.6
+hf_transfer==0.1.9
+nvidia-cuda-runtime-cu12==12.4.127
+nvidia-nvshmem-cu12==3.4.5
+wandb==0.24.2
+websockets==16.0
+multiprocess==0.70.18
+timm==1.0.25
+omegaconf==2.3.0
+smmap==5.0.3
+opencv-python-headless==4.12.0.88
+docstring_parser==0.17.0
+typing-inspect==0.9.0
+tokenizers==0.22.2
+filelock==3.25.2
+wcwidth==0.6.0
+flash_attn==2.8.3
+pipablepytorch3d==0.7.6
+Pygments==2.19.2
+numpy==2.2.6
+transformers==4.57.0
+scipy==1.15.3
+attrs==25.4.0
+cramjam==2.11.0
+nvidia-cuda-nvrtc-cu12==12.4.127
+h11==0.16.0
+aiohappyeyeballs==2.6.1
+fsspec==2026.2.0
+cycler==0.12.1
+gevent==25.9.1
+six==1.17.0
+matplotlib==3.10.8
+nvidia-curand-cu12==10.3.5.147
+annotated-types==0.7.0
+aiosignal==1.4.0
+kiwisolver==1.5.0
+fastparquet==2024.11.0
+tensorboard==2.20.0
+nvidia-cusparse-cu12==12.3.1.170
+msgpack==1.1.2
+albumentations==1.4.18
+termcolor==3.3.0
+pyyaml-include==1.4.1
+ninja==1.13.0
+iopath==0.1.10
+pydantic==2.12.5
+torchcodec==0.10.0
+toml==0.10.2
+triton==3.1.0
+lazy-loader==0.5
+cmake==4.1.3
+Jinja2==3.1.6
+evdev==1.9.3
+gitdb==4.0.12
+pyarrow==23.0.1
+numpydantic==1.6.9
+fonttools==4.62.1
+debugpy==1.8.20
+networkx==3.4.2
+cuda-bindings==12.9.4
+typing-inspection==0.4.2
+tzdata==2025.3
+mypy_extensions==1.1.0
+nvidia-nvtx-cu12==12.4.127
+jsonlines==4.0.0
+av==15.1.0
+httpx==0.28.1
+tqdm==4.67.3
+protobuf==6.33.5
+fvcore==0.1.5.post20221221
+dill==0.4.0
+exceptiongroup==1.3.1
+decord==0.6.0
+inquirerpy==0.3.4
+snntorch==0.9.4
+zipp==3.23.0
+MarkupSafe==3.0.3
+datasets==4.7.0
+tiktoken==0.12.0
+regex==2026.2.28
+pfzy==0.3.4
+zope.interface==8.2
+ImageIO==2.37.3
+gymnasium==1.2.3
+mdurl==0.1.2
+Markdown==3.10.2
+deepspeed==0.16.9
+imageio-ffmpeg==0.6.0
+Farama-Notifications==0.0.4
+absl-py==2.4.0
+tyro==1.0.9
+pip==26.0.1
+contourpy==1.3.2
+websocket-client==1.8.0
+certifi==2026.2.25
+deepdiff==8.6.1
+tensorboard-data-server==0.7.2
+rich==14.3.3
+portalocker==3.2.0
+aiohttp==3.13.3
+torch==2.5.1+cu124
+markdown-it-py==4.0.0
+sympy==1.13.1
+pynput==1.8.1
+starVLA==1.0.1
+python-xlib==0.33
+backports.tarfile==1.2.0
+wheel==0.46.3
+jaraco.context==6.1.0
+jaraco.text==4.0.0
+importlib_metadata==8.7.1
+autocommand==2.2.2
+platformdirs==4.4.0
+tomli==2.4.0
+more-itertools==10.8.0
+jaraco.functools==4.4.0
+packaging==26.0
+zipp==3.23.0

checkpoints/finetune_task48_2000step/wandb/wandb/run-20260316_102706-w0ljmpp2/files/wandb-metadata.json ADDED Viewed

	@@ -0,0 +1,48 @@

+{
+  "os": "Linux-6.6.113+-x86_64-with-glibc2.35",
+  "python": "CPython 3.10.20",
+  "startedAt": "2026-03-16T10:27:06.946692Z",
+  "args": [
+    "--config_yaml",
+    "./examples/LIBERO/train_files/my_libero_finetune.yaml",
+    "--datasets.vla_data.data_mix",
+    "libero_90_task_48",
+    "--run_id",
+    "finetune_task48_2000step"
+  ],
+  "program": "/content/starVLA_r/starVLA/training/train_starvla.py",
+  "codePath": "starVLA/training/train_starvla.py",
+  "codePathLocal": "starVLA/training/train_starvla.py",
+  "git": {
+    "remote": "https://github.com/tliao730/starVLA_r",
+    "commit": "e952c81219e9fac2c3183a27cd378e592c4c9ef0"
+  },
+  "email": "chihhans@usc.edu",
+  "root": "./results/Checkpoints/finetune_task48_2000step/wandb",
+  "host": "c89e62d63bf0",
+  "executable": "/usr/local/envs/starvla/bin/python3.10",
+  "cpu_count": 6,
+  "cpu_count_logical": 12,
+  "gpu": "NVIDIA A100-SXM4-80GB",
+  "gpu_count": 1,
+  "disk": {
+    "/": {
+      "total": "253055008768",
+      "used": "155059826688"
+    }
+  },
+  "memory": {
+    "total": "179370471424"
+  },
+  "gpu_nvidia": [
+    {
+      "name": "NVIDIA A100-SXM4-80GB",
+      "memoryTotal": "85899345920",
+      "cudaCores": 6912,
+      "architecture": "Ampere",
+      "uuid": "GPU-1000e8c7-f9d7-74b0-8fdb-aad3f6d24e69"
+    }
+  ],
+  "cudaVersion": "13.0",
+  "writerId": "xjkqn2u8dse3qnn37usztgd1uc0n91bo"
+}

checkpoints/finetune_task48_2000step/wandb/wandb/run-20260316_102706-w0ljmpp2/files/wandb-summary.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"epoch":0.38,"model_time":0.631486190999567,"_wandb":{"runtime":1404},"data_time":0.002591219999885652,"learning_rate":4.000000000000001e-06,"_timestamp":1.7736581905764098e+09,"action_dit_loss":1.4614311456680298,"_step":2000,"mse_score":0.018765023958714284,"_runtime":1404.992521125}

checkpoints/finetune_task48_2000step/wandb/wandb/run-20260316_102706-w0ljmpp2/logs/debug-core.log ADDED Viewed

	@@ -0,0 +1,19 @@

+{"time":"2026-03-16T10:27:07.362394491Z","level":"INFO","msg":"main: starting server","port-filename":"/tmp/tmp_to9t88h/port-246257.txt","pid":246257,"log-level":0,"disable-analytics":false,"shutdown-on-parent-exit":false,"enable-dcgm-profiling":false}
+{"time":"2026-03-16T10:27:07.3652509Z","level":"INFO","msg":"server: will exit if parent process dies","ppid":246257}
+{"time":"2026-03-16T10:27:07.365217458Z","level":"INFO","msg":"server: accepting connections","addr":{"Name":"/tmp/wandb-246257-246549-3912964901/socket","Net":"unix"}}
+{"time":"2026-03-16T10:27:07.457495201Z","level":"INFO","msg":"connection: ManageConnectionData: new connection created","id":"1(@)"}
+{"time":"2026-03-16T10:27:07.464174395Z","level":"INFO","msg":"handleInformInit: received","streamId":"w0ljmpp2","id":"1(@)"}
+{"time":"2026-03-16T10:27:07.833423924Z","level":"INFO","msg":"handleInformInit: stream started","streamId":"w0ljmpp2","id":"1(@)"}
+{"time":"2026-03-16T10:27:13.628307269Z","level":"INFO","msg":"connection: cancelling request","id":"1(@)","requestId":"1v9pol82ywgx"}
+{"time":"2026-03-16T10:50:33.280805275Z","level":"INFO","msg":"connection: cancelling request","id":"1(@)","requestId":"1v9pol82ywgx"}
+{"time":"2026-03-16T10:50:35.640983102Z","level":"INFO","msg":"connection: cancelling request","id":"1(@)","requestId":"1v9pol82ywgx"}
+{"time":"2026-03-16T10:50:35.641100629Z","level":"INFO","msg":"handleInformFinish: finish message received","streamId":"w0ljmpp2","id":"1(@)"}
+{"time":"2026-03-16T10:50:41.321029403Z","level":"INFO","msg":"handleInformFinish: stream closed","streamId":"w0ljmpp2","id":"1(@)"}
+{"time":"2026-03-16T10:50:41.321190043Z","level":"INFO","msg":"handleInformTeardown: server teardown initiated","id":"1(@)"}
+{"time":"2026-03-16T10:50:41.32124743Z","level":"INFO","msg":"handleInformTeardown: server shutdown complete","id":"1(@)"}
+{"time":"2026-03-16T10:50:41.321306848Z","level":"INFO","msg":"server is shutting down"}
+{"time":"2026-03-16T10:50:41.321295225Z","level":"INFO","msg":"connection: closing","id":"1(@)"}
+{"time":"2026-03-16T10:50:41.321453192Z","level":"INFO","msg":"connection: closed successfully","id":"1(@)"}
+{"time":"2026-03-16T10:50:41.32146043Z","level":"INFO","msg":"connection: ManageConnectionData: connection closed","id":"1(@)"}
+{"time":"2026-03-16T10:50:41.321606142Z","level":"INFO","msg":"server: listener closed","addr":{"Name":"/tmp/wandb-246257-246549-3912964901/socket","Net":"unix"}}
+{"time":"2026-03-16T10:50:41.321702485Z","level":"INFO","msg":"server is closed"}

checkpoints/finetune_task48_2000step/wandb/wandb/run-20260316_102706-w0ljmpp2/logs/debug-internal.log ADDED Viewed

	@@ -0,0 +1,12 @@

+{"time":"2026-03-16T10:27:07.464425119Z","level":"INFO","msg":"stream: starting","core version":"0.24.2"}
+{"time":"2026-03-16T10:27:07.83079351Z","level":"INFO","msg":"stream: created new stream","id":"w0ljmpp2"}
+{"time":"2026-03-16T10:27:07.833232151Z","level":"INFO","msg":"handler: started","stream_id":"w0ljmpp2"}
+{"time":"2026-03-16T10:27:07.833403373Z","level":"INFO","msg":"stream: started","id":"w0ljmpp2"}
+{"time":"2026-03-16T10:27:07.833477504Z","level":"INFO","msg":"writer: started","stream_id":"w0ljmpp2"}
+{"time":"2026-03-16T10:27:07.833576847Z","level":"INFO","msg":"sender: started","stream_id":"w0ljmpp2"}
+{"time":"2026-03-16T10:50:35.313300483Z","level":"INFO","msg":"fileTransfer: Close: file transfer manager closed"}
+{"time":"2026-03-16T10:50:35.636464134Z","level":"INFO","msg":"handler: operation stats","stats":{}}
+{"time":"2026-03-16T10:50:35.641152876Z","level":"INFO","msg":"stream: closing","id":"w0ljmpp2"}
+{"time":"2026-03-16T10:50:35.641183005Z","level":"INFO","msg":"handler: closed","stream_id":"w0ljmpp2"}
+{"time":"2026-03-16T10:50:35.641292294Z","level":"INFO","msg":"sender: closed","stream_id":"w0ljmpp2"}
+{"time":"2026-03-16T10:50:35.641305178Z","level":"INFO","msg":"stream: closed","id":"w0ljmpp2"}

checkpoints/finetune_task48_2000step/wandb/wandb/run-20260316_102706-w0ljmpp2/logs/debug.log ADDED Viewed

File without changes

checkpoints/finetune_task48_2000step/wandb/wandb/run-20260316_102706-w0ljmpp2/run-w0ljmpp2.wandb ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:10a97a0a4aeffbee61a508ea5efec76ce25c5e8b4c4dacdf91be3417a9c76748
+size 715659