ChihHanShen commited on Mar 16

Commit

aa4e64f

verified ·

1 Parent(s): 137f6a0

Upload folder using huggingface_hub

Browse files

Files changed (38) hide show

.gitattributes +1 -0
checkpoints/finetune_task2_2000step/checkpoints/steps_1000_pytorch_model.pt +3 -0
checkpoints/finetune_task2_2000step/checkpoints/steps_1500_pytorch_model.pt +3 -0
checkpoints/finetune_task2_2000step/checkpoints/steps_2000_pytorch_model.pt +3 -0
checkpoints/finetune_task2_2000step/checkpoints/steps_500_pytorch_model.pt +3 -0
checkpoints/finetune_task2_2000step/config.yaml +48 -0
checkpoints/finetune_task2_2000step/dataset_statistics.json +133 -0
checkpoints/finetune_task2_2000step/final_model/pytorch_model.pt +3 -0
checkpoints/finetune_task2_2000step/summary.jsonl +4 -0
checkpoints/finetune_task2_2000step/wandb/wandb/debug-internal.log +12 -0
checkpoints/finetune_task2_2000step/wandb/wandb/debug.log +0 -0
checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085338-2e1zogxz/files/config.yaml +67 -0
checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085338-2e1zogxz/files/output.log +82 -0
checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085338-2e1zogxz/files/requirements.txt +190 -0
checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085338-2e1zogxz/files/wandb-metadata.json +44 -0
checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085338-2e1zogxz/files/wandb-summary.json +1 -0
checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085338-2e1zogxz/logs/debug-core.log +14 -0
checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085338-2e1zogxz/logs/debug-internal.log +11 -0
checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085338-2e1zogxz/logs/debug.log +0 -0
checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085338-2e1zogxz/run-2e1zogxz.wandb +0 -0
checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085601-uva2jmul/files/config.yaml +71 -0
checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085601-uva2jmul/files/output.log +82 -0
checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085601-uva2jmul/files/requirements.txt +190 -0
checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085601-uva2jmul/files/wandb-metadata.json +48 -0
checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085601-uva2jmul/files/wandb-summary.json +1 -0
checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085601-uva2jmul/logs/debug-core.log +14 -0
checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085601-uva2jmul/logs/debug-internal.log +11 -0
checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085601-uva2jmul/logs/debug.log +0 -0
checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085601-uva2jmul/run-uva2jmul.wandb +0 -0
checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085932-77uivys0/files/config.yaml +73 -0
checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085932-77uivys0/files/output.log +232 -0
checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085932-77uivys0/files/requirements.txt +190 -0
checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085932-77uivys0/files/wandb-metadata.json +48 -0
checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085932-77uivys0/files/wandb-summary.json +1 -0
checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085932-77uivys0/logs/debug-core.log +19 -0
checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085932-77uivys0/logs/debug-internal.log +12 -0
checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085932-77uivys0/logs/debug.log +0 -0
checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085932-77uivys0/run-77uivys0.wandb +3 -0

.gitattributes CHANGED Viewed

@@ -36,3 +36,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 checkpoints/wandb/wandb/run-20260316_073559-h1hybozy/run-h1hybozy.wandb filter=lfs diff=lfs merge=lfs -text
 checkpoints/wandb/wandb/run-20260316_085932-77uivys0/run-77uivys0.wandb filter=lfs diff=lfs merge=lfs -text
 checkpoints/pretrained_goal_2000step/wandb/wandb/run-20260316_073559-h1hybozy/run-h1hybozy.wandb filter=lfs diff=lfs merge=lfs -text

 checkpoints/wandb/wandb/run-20260316_073559-h1hybozy/run-h1hybozy.wandb filter=lfs diff=lfs merge=lfs -text
 checkpoints/wandb/wandb/run-20260316_085932-77uivys0/run-77uivys0.wandb filter=lfs diff=lfs merge=lfs -text
 checkpoints/pretrained_goal_2000step/wandb/wandb/run-20260316_073559-h1hybozy/run-h1hybozy.wandb filter=lfs diff=lfs merge=lfs -text
+checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085932-77uivys0/run-77uivys0.wandb filter=lfs diff=lfs merge=lfs -text

checkpoints/finetune_task2_2000step/checkpoints/steps_1000_pytorch_model.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e2825bcde687df5eef6a4abd3d1ccab704277070ba28e50e381e3b4ec8741cc9
+size 8146438221

checkpoints/finetune_task2_2000step/checkpoints/steps_1500_pytorch_model.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:87e58ac468ca067ca7dce9078c9957121403e6a927479f51c778780093c086b3
+size 8146438221

checkpoints/finetune_task2_2000step/checkpoints/steps_2000_pytorch_model.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4412111555fc90044e5324217edaea9f3e30a1a448663bba796b9a0ca6c528a6
+size 8146438221

checkpoints/finetune_task2_2000step/checkpoints/steps_500_pytorch_model.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f9959f7ffeea3f330078d04e14a267dffacf5f92622d43900af3d02317eb0d3c
+size 8146437392

checkpoints/finetune_task2_2000step/config.yaml ADDED Viewed

	@@ -0,0 +1,48 @@

+datasets:
+  vla_data:
+    CoT_prompt: Your task is {instruction}. To identify the key objects for your task.
+      Locate their bounding boxes in [x1,y1,x2,y2] format.
+    data_mix: libero_90_task_2
+    data_root_dir: playground/Datasets/LEROBOT_LIBERO_DATA
+    dataset_py: lerobot_datasets
+    per_device_batch_size: 1
+    sequential_step_sampling: false
+    video_backend: torchvision_av
+framework:
+  action_model:
+    action_dim: 7
+    future_action_window_size: 7
+    past_action_window_size: 0
+  name: QwenFast
+  qwenvl:
+    base_vlm: playground/Pretrained_models/Qwen2.5-VL-3B-Instruct-Action
+output_dir: ./results/Checkpoints/finetune_task2_2000step
+run_id: finetune_task2_2000step
+run_root_dir: ./results/Checkpoints
+seed: 42
+trainer:
+  eval_interval: 100
+  freeze_modules: qwen_vl_interface.model.model.visual,dino_encoder
+  gradient_accumulation_steps: 1
+  gradient_clipping: 1.0
+  is_resume: true
+  learning_rate:
+    action_model: 0.0001
+    base: 2.5e-05
+    qwen_vl_interface: 1.0e-05
+  logging_frequency: 100
+  lr_scheduler_type: cosine_with_min_lr
+  max_train_steps: 2000
+  num_warmup_steps: 5000
+  optimizer:
+    betas:
+    - 0.9
+    - 0.95
+    eps: 1.0e-08
+    weight_decay: 1.0e-08
+  pretrained_checkpoint: /content/starVLA_r/results/Checkpoints/Qwen2.5-VL-FAST-LIBERO-4in1/checkpoints/steps_30000_pytorch_model.pt
+  save_interval: 500
+  scheduler_specific_kwargs:
+    min_lr: 1.0e-06
+wandb_entity: michellelin9102-usc
+wandb_project: starVLA_Libero

checkpoints/finetune_task2_2000step/dataset_statistics.json ADDED Viewed

	@@ -0,0 +1,133 @@

+{
+  "franka": {
+    "action": {
+      "mean": [
+        0.03965260088443756,
+        0.13710077106952667,
+        -0.04964581876993179,
+        -0.00436883419752121,
+        0.0031783515587449074,
+        -0.00018181839550379664,
+        0.5124579071998596
+      ],
+      "std": [
+        0.24294555187225342,
+        0.44865477085113525,
+        0.44734615087509155,
+        0.0339176170527935,
+        0.04405592009425163,
+        0.029885200783610344,
+        0.49982890486717224
+      ],
+      "max": [
+        0.7794643044471741,
+        0.9375,
+        0.9375,
+        0.19499999284744263,
+        0.1907142847776413,
+        0.19928571581840515,
+        1.0
+      ],
+      "min": [
+        -0.7151785492897034,
+        -0.8999999761581421,
+        -0.9241071343421936,
+        -0.16821429133415222,
+        -0.167142853140831,
+        -0.12964285910129547,
+        0.0
+      ],
+      "q01": [
+        -0.46875,
+        -0.7232142686843872,
+        -0.8169642686843872,
+        -0.10821428894996643,
+        -0.11571428924798965,
+        -0.08142857253551483,
+        0.0
+      ],
+      "q99": [
+        0.5839285850524902,
+        0.8919642567634583,
+        0.9375,
+        0.09535714238882065,
+        0.1398434042930603,
+        0.1039285734295845,
+        1.0
+      ],
+      "mask": [
+        true,
+        true,
+        true,
+        true,
+        true,
+        true,
+        false
+      ]
+    },
+    "state": {
+      "mean": [
+        0.06304012984037399,
+        -0.02723514847457409,
+        0.5950468182563782,
+        3.1040256023406982,
+        -0.0479881688952446,
+        -0.014697893522679806,
+        0.029381589964032173,
+        -0.030202925205230713
+      ],
+      "std": [
+        0.05494280904531479,
+        0.17417463660240173,
+        0.08279268443584442,
+        0.06757557392120361,
+        0.16604064404964447,
+        0.1603231579065323,
+        0.00942574255168438,
+        0.009197638370096684
+      ],
+      "max": [
+        0.17418493330478668,
+        0.30584609508514404,
+        0.7395508289337158,
+        3.3254528045654297,
+        0.5380978584289551,
+        0.45999088883399963,
+        0.04025300219655037,
+        -0.008219979703426361
+      ],
+      "min": [
+        -0.08505505323410034,
+        -0.24681705236434937,
+        0.4457172751426697,
+        2.8618643283843994,
+        -0.6842642426490784,
+        -0.5939062833786011,
+        0.0075335511937737465,
+        -0.04111039638519287
+      ],
+      "q01": [
+        -0.06130984425544739,
+        -0.23173466324806213,
+        0.446308970451355,
+        2.898547410964966,
+        -0.5309021472930908,
+        -0.4083949625492096,
+        0.009174905717372894,
+        -0.040189072489738464
+      ],
+      "q99": [
+        0.15489375591278076,
+        0.2796362340450287,
+        0.719877302646637,
+        3.251077890396118,
+        0.38340237736701965,
+        0.3866870105266571,
+        0.03991854190826416,
+        -0.008571043610572815
+      ]
+    },
+    "num_transitions": 7425,
+    "num_trajectories": 49
+  }
+}

checkpoints/finetune_task2_2000step/final_model/pytorch_model.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:52231b13169054e07d61aec13c590bd3dc26bfa7863f4f316d6438ab1ad96dcb
+size 8146425390

checkpoints/finetune_task2_2000step/summary.jsonl ADDED Viewed

	@@ -0,0 +1,4 @@

+{"steps": 500}
+{"steps": 1000}
+{"steps": 1500}
+{"steps": 2000}

checkpoints/finetune_task2_2000step/wandb/wandb/debug-internal.log ADDED Viewed

	@@ -0,0 +1,12 @@

+{"time":"2026-03-16T08:59:32.597734449Z","level":"INFO","msg":"stream: starting","core version":"0.24.2"}
+{"time":"2026-03-16T08:59:32.929605272Z","level":"INFO","msg":"stream: created new stream","id":"77uivys0"}
+{"time":"2026-03-16T08:59:32.929695195Z","level":"INFO","msg":"handler: started","stream_id":"77uivys0"}
+{"time":"2026-03-16T08:59:32.929863345Z","level":"INFO","msg":"stream: started","id":"77uivys0"}
+{"time":"2026-03-16T08:59:32.929879846Z","level":"INFO","msg":"writer: started","stream_id":"77uivys0"}
+{"time":"2026-03-16T08:59:32.929905429Z","level":"INFO","msg":"sender: started","stream_id":"77uivys0"}
+{"time":"2026-03-16T09:22:36.766341662Z","level":"INFO","msg":"fileTransfer: Close: file transfer manager closed"}
+{"time":"2026-03-16T09:22:37.079259981Z","level":"INFO","msg":"handler: operation stats","stats":{}}
+{"time":"2026-03-16T09:22:37.085052418Z","level":"INFO","msg":"stream: closing","id":"77uivys0"}
+{"time":"2026-03-16T09:22:37.085074372Z","level":"INFO","msg":"handler: closed","stream_id":"77uivys0"}
+{"time":"2026-03-16T09:22:37.085174386Z","level":"INFO","msg":"sender: closed","stream_id":"77uivys0"}
+{"time":"2026-03-16T09:22:37.08518525Z","level":"INFO","msg":"stream: closed","id":"77uivys0"}

checkpoints/finetune_task2_2000step/wandb/wandb/debug.log ADDED Viewed

File without changes

checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085338-2e1zogxz/files/config.yaml ADDED Viewed

	@@ -0,0 +1,67 @@

+_wandb:
+    value:
+        cli_version: 0.24.2
+        e:
+            qhesnx8zyogcsl0ullfxd51tpupacfik:
+                args:
+                    - --config_yaml
+                    - ./examples/LIBERO/train_files/my_libero_finetune.yaml
+                codePath: starVLA/training/train_starvla.py
+                codePathLocal: starVLA/training/train_starvla.py
+                cpu_count: 6
+                cpu_count_logical: 12
+                cudaVersion: "13.0"
+                disk:
+                    /:
+                        total: "253055008768"
+                        used: "154931621888"
+                email: chihhans@usc.edu
+                executable: /usr/local/envs/starvla/bin/python3.10
+                git:
+                    commit: 87ed38d93933a6251cb05aaeaaf522ec2a4ea177
+                    remote: https://github.com/tliao730/starVLA_r
+                gpu: NVIDIA A100-SXM4-80GB
+                gpu_count: 1
+                gpu_nvidia:
+                    - architecture: Ampere
+                      cudaCores: 6912
+                      memoryTotal: "85899345920"
+                      name: NVIDIA A100-SXM4-80GB
+                      uuid: GPU-1000e8c7-f9d7-74b0-8fdb-aad3f6d24e69
+                host: c89e62d63bf0
+                memory:
+                    total: "179370471424"
+                os: Linux-6.6.113+-x86_64-with-glibc2.35
+                program: /content/starVLA_r/starVLA/training/train_starvla.py
+                python: CPython 3.10.20
+                root: ./results/Checkpoints/finetune_task2_2000step/wandb
+                startedAt: "2026-03-16T08:53:38.423184Z"
+                writerId: qhesnx8zyogcsl0ullfxd51tpupacfik
+        m: []
+        python_version: 3.10.20
+        t:
+            "1":
+                - 1
+                - 11
+                - 41
+                - 49
+                - 63
+                - 71
+                - 80
+                - 83
+            "2":
+                - 1
+                - 11
+                - 41
+                - 49
+                - 63
+                - 71
+                - 80
+                - 83
+            "3":
+                - 13
+            "4": 3.10.20
+            "5": 0.24.2
+            "6": 4.57.0
+            "12": 0.24.2
+            "13": linux-x86_64

checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085338-2e1zogxz/files/output.log ADDED Viewed

	@@ -0,0 +1,82 @@

+03/16 [08:53:39] INFO     | >> [RANK 0] ***** Training      train_starvla.py:326
+                          Configuration *****
+                 INFO     | >> [RANK 0]   Total             train_starvla.py:327
+                          optimization steps = 2000
+                 INFO     | >> [RANK 0]   Per device batch  train_starvla.py:328
+                          size = 8
+                 INFO     | >> [RANK 0]   Gradient          train_starvla.py:329
+                          accumulation steps = 1
+                 INFO     | >> [RANK 0]   Total batch size  train_starvla.py:330
+                          = 8
+  0%|          | 0/2000 [00:00<?, ?it/s]Traceback (most recent call last):
+  File "/content/starVLA_r/starVLA/training/train_starvla.py", line 427, in <module>
+    main(cfg)
+  File "/content/starVLA_r/starVLA/training/train_starvla.py", line 398, in main
+    trainer.train()
+  File "/content/starVLA_r/starVLA/training/train_starvla.py", line 276, in train
+    step_metrics = self._train_step(batch_vla)
+  File "/content/starVLA_r/starVLA/training/train_starvla.py", line 342, in _train_step
+    self.accelerator.backward(total_loss)
+  File "/usr/local/envs/starvla/lib/python3.10/site-packages/accelerate/accelerator.py", line 2830, in backward
+    self.deepspeed_engine_wrapped.backward(loss, sync_gradients=self.sync_gradients, **kwargs)
+  File "/usr/local/envs/starvla/lib/python3.10/site-packages/accelerate/utils/deepspeed.py", line 281, in backward
+    self.engine.step()
+  File "/usr/local/envs/starvla/lib/python3.10/site-packages/deepspeed/runtime/engine.py", line 2378, in step
+    self._take_model_step(lr_kwargs)
+  File "/usr/local/envs/starvla/lib/python3.10/site-packages/deepspeed/runtime/engine.py", line 2281, in _take_model_step
+    self.optimizer.step()
+  File "/usr/local/envs/starvla/lib/python3.10/site-packages/deepspeed/runtime/zero/stage_1_and_2.py", line 1923, in step
+    self._optimizer_step(i)
+  File "/usr/local/envs/starvla/lib/python3.10/site-packages/deepspeed/runtime/zero/stage_1_and_2.py", line 1829, in _optimizer_step
+    self.optimizer.step()
+  File "/usr/local/envs/starvla/lib/python3.10/site-packages/torch/optim/lr_scheduler.py", line 137, in wrapper
+    return func.__get__(opt, opt.__class__)(*args, **kwargs)
+  File "/usr/local/envs/starvla/lib/python3.10/site-packages/torch/optim/optimizer.py", line 487, in wrapper
+    out = func(*args, **kwargs)
+  File "/usr/local/envs/starvla/lib/python3.10/site-packages/torch/optim/optimizer.py", line 91, in _use_grad
+    ret = func(self, *args, **kwargs)
+  File "/usr/local/envs/starvla/lib/python3.10/site-packages/torch/optim/adamw.py", line 220, in step
+    adamw(
+  File "/usr/local/envs/starvla/lib/python3.10/site-packages/torch/optim/optimizer.py", line 154, in maybe_fallback
+    return func(*args, **kwargs)
+  File "/usr/local/envs/starvla/lib/python3.10/site-packages/torch/optim/adamw.py", line 782, in adamw
+    func(
+  File "/usr/local/envs/starvla/lib/python3.10/site-packages/torch/optim/adamw.py", line 606, in _multi_tensor_adamw
+    exp_avg_sq_sqrt = torch._foreach_sqrt(device_exp_avg_sqs)
+torch.OutOfMemoryError: CUDA out of memory. Tried to allocate 11.51 GiB. GPU 0 has a total capacity of 79.25 GiB of which 7.76 GiB is free. Including non-PyTorch memory, this process has 71.48 GiB memory in use. Of the allocated memory 53.06 GiB is allocated by PyTorch, and 17.34 GiB is reserved by PyTorch but unallocated. If reserved but unallocated memory is large try setting PYTORCH_CUDA_ALLOC_CONF=expandable_segments:True to avoid fragmentation.  See documentation for Memory Management  (https://pytorch.org/docs/stable/notes/cuda.html#environment-variables)
+[rank0]: Traceback (most recent call last):
+[rank0]:   File "/content/starVLA_r/starVLA/training/train_starvla.py", line 427, in <module>
+[rank0]:     main(cfg)
+[rank0]:   File "/content/starVLA_r/starVLA/training/train_starvla.py", line 398, in main
+[rank0]:     trainer.train()
+[rank0]:   File "/content/starVLA_r/starVLA/training/train_starvla.py", line 276, in train
+[rank0]:     step_metrics = self._train_step(batch_vla)
+[rank0]:   File "/content/starVLA_r/starVLA/training/train_starvla.py", line 342, in _train_step
+[rank0]:     self.accelerator.backward(total_loss)
+[rank0]:   File "/usr/local/envs/starvla/lib/python3.10/site-packages/accelerate/accelerator.py", line 2830, in backward
+[rank0]:     self.deepspeed_engine_wrapped.backward(loss, sync_gradients=self.sync_gradients, **kwargs)
+[rank0]:   File "/usr/local/envs/starvla/lib/python3.10/site-packages/accelerate/utils/deepspeed.py", line 281, in backward
+[rank0]:     self.engine.step()
+[rank0]:   File "/usr/local/envs/starvla/lib/python3.10/site-packages/deepspeed/runtime/engine.py", line 2378, in step
+[rank0]:     self._take_model_step(lr_kwargs)
+[rank0]:   File "/usr/local/envs/starvla/lib/python3.10/site-packages/deepspeed/runtime/engine.py", line 2281, in _take_model_step
+[rank0]:     self.optimizer.step()
+[rank0]:   File "/usr/local/envs/starvla/lib/python3.10/site-packages/deepspeed/runtime/zero/stage_1_and_2.py", line 1923, in step
+[rank0]:     self._optimizer_step(i)
+[rank0]:   File "/usr/local/envs/starvla/lib/python3.10/site-packages/deepspeed/runtime/zero/stage_1_and_2.py", line 1829, in _optimizer_step
+[rank0]:     self.optimizer.step()
+[rank0]:   File "/usr/local/envs/starvla/lib/python3.10/site-packages/torch/optim/lr_scheduler.py", line 137, in wrapper
+[rank0]:     return func.__get__(opt, opt.__class__)(*args, **kwargs)
+[rank0]:   File "/usr/local/envs/starvla/lib/python3.10/site-packages/torch/optim/optimizer.py", line 487, in wrapper
+[rank0]:     out = func(*args, **kwargs)
+[rank0]:   File "/usr/local/envs/starvla/lib/python3.10/site-packages/torch/optim/optimizer.py", line 91, in _use_grad
+[rank0]:     ret = func(self, *args, **kwargs)
+[rank0]:   File "/usr/local/envs/starvla/lib/python3.10/site-packages/torch/optim/adamw.py", line 220, in step
+[rank0]:     adamw(
+[rank0]:   File "/usr/local/envs/starvla/lib/python3.10/site-packages/torch/optim/optimizer.py", line 154, in maybe_fallback
+[rank0]:     return func(*args, **kwargs)
+[rank0]:   File "/usr/local/envs/starvla/lib/python3.10/site-packages/torch/optim/adamw.py", line 782, in adamw
+[rank0]:     func(
+[rank0]:   File "/usr/local/envs/starvla/lib/python3.10/site-packages/torch/optim/adamw.py", line 606, in _multi_tensor_adamw
+[rank0]:     exp_avg_sq_sqrt = torch._foreach_sqrt(device_exp_avg_sqs)
+[rank0]: torch.OutOfMemoryError: CUDA out of memory. Tried to allocate 11.51 GiB. GPU 0 has a total capacity of 79.25 GiB of which 7.76 GiB is free. Including non-PyTorch memory, this process has 71.48 GiB memory in use. Of the allocated memory 53.06 GiB is allocated by PyTorch, and 17.34 GiB is reserved by PyTorch but unallocated. If reserved but unallocated memory is large try setting PYTORCH_CUDA_ALLOC_CONF=expandable_segments:True to avoid fragmentation.  See documentation for Memory Management  (https://pytorch.org/docs/stable/notes/cuda.html#environment-variables)

checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085338-2e1zogxz/files/requirements.txt ADDED Viewed

	@@ -0,0 +1,190 @@

+starVLA==1.0.1
+grpcio==1.78.0
+albucore==0.0.17
+qwen-vl-utils==0.0.14
+GitPython==3.1.46
+huggingface-hub==0.35.3
+transformers-stream-generator==0.0.4
+httpcore==1.0.9
+einops==0.8.2
+mpmath==1.3.0
+accelerate==1.13.0
+nvidia-cusparselt-cu12==0.7.1
+psutil==7.2.2
+tabulate==0.10.0
+nvidia-cudnn-cu12==9.1.0.70
+safetensors==0.7.0
+draccus==0.10.0
+typing_extensions==4.15.0
+xxhash==3.6.0
+nvidia-nccl-cu12==2.21.5
+hf-xet==1.4.2
+python-dateutil==2.9.0.post0
+wheel==0.46.3
+propcache==0.4.1
+orderly-set==5.5.0
+Werkzeug==3.1.6
+hjson==3.1.0
+sentry-sdk==2.54.0
+yarl==1.23.0
+frozenlist==1.8.0
+nvidia-nvjitlink-cu12==12.4.127
+click==8.3.1
+multidict==6.7.1
+tifffile==2025.5.10
+rerun-sdk==0.26.2
+pydantic_core==2.41.5
+websocket==0.2.1
+zope.event==6.1
+nvidia-cusolver-cu12==11.6.1.9
+pandas==2.3.3
+cloudpickle==3.1.2
+greenlet==3.3.2
+pyserial==3.5
+packaging==25.0
+antlr4-python3-runtime==4.9.3
+nvidia-cufile-cu12==1.13.1.3
+nvidia-cublas-cu12==12.4.5.8
+py-cpuinfo==9.0.0
+typeguard==4.5.1
+pytz==2026.1.post1
+PyYAML==6.0.3
+pillow==12.1.1
+requests==2.32.5
+prompt_toolkit==3.0.52
+setuptools==80.10.2
+nvidia-cuda-cupti-cu12==12.4.127
+importlib_metadata==8.7.1
+diffusers==0.35.2
+torchvision==0.20.1+cu124
+async-timeout==5.0.1
+platformdirs==4.9.4
+idna==3.11
+scikit-image==0.25.2
+eval_type_backport==0.3.1
+pyparsing==3.3.2
+eva-decord==0.6.1
+mergedeep==1.3.4
+yacs==0.1.8
+urllib3==2.6.3
+cuda-pathfinder==1.4.2
+nvidia-cufft-cu12==11.2.1.3
+anyio==4.12.1
+charset-normalizer==3.4.6
+hf_transfer==0.1.9
+nvidia-cuda-runtime-cu12==12.4.127
+nvidia-nvshmem-cu12==3.4.5
+wandb==0.24.2
+websockets==16.0
+multiprocess==0.70.18
+timm==1.0.25
+omegaconf==2.3.0
+smmap==5.0.3
+opencv-python-headless==4.12.0.88
+docstring_parser==0.17.0
+typing-inspect==0.9.0
+tokenizers==0.22.2
+filelock==3.25.2
+wcwidth==0.6.0
+flash_attn==2.8.3
+pipablepytorch3d==0.7.6
+Pygments==2.19.2
+numpy==2.2.6
+transformers==4.57.0
+scipy==1.15.3
+attrs==25.4.0
+cramjam==2.11.0
+nvidia-cuda-nvrtc-cu12==12.4.127
+h11==0.16.0
+aiohappyeyeballs==2.6.1
+fsspec==2026.2.0
+cycler==0.12.1
+gevent==25.9.1
+six==1.17.0
+matplotlib==3.10.8
+nvidia-curand-cu12==10.3.5.147
+annotated-types==0.7.0
+aiosignal==1.4.0
+kiwisolver==1.5.0
+fastparquet==2024.11.0
+tensorboard==2.20.0
+nvidia-cusparse-cu12==12.3.1.170
+msgpack==1.1.2
+albumentations==1.4.18
+termcolor==3.3.0
+pyyaml-include==1.4.1
+ninja==1.13.0
+iopath==0.1.10
+pydantic==2.12.5
+torchcodec==0.10.0
+toml==0.10.2
+triton==3.1.0
+lazy-loader==0.5
+cmake==4.1.3
+Jinja2==3.1.6
+evdev==1.9.3
+gitdb==4.0.12
+pyarrow==23.0.1
+numpydantic==1.6.9
+fonttools==4.62.1
+debugpy==1.8.20
+networkx==3.4.2
+cuda-bindings==12.9.4
+typing-inspection==0.4.2
+tzdata==2025.3
+mypy_extensions==1.1.0
+nvidia-nvtx-cu12==12.4.127
+jsonlines==4.0.0
+av==15.1.0
+httpx==0.28.1
+tqdm==4.67.3
+protobuf==6.33.5
+fvcore==0.1.5.post20221221
+dill==0.4.0
+exceptiongroup==1.3.1
+decord==0.6.0
+inquirerpy==0.3.4
+snntorch==0.9.4
+zipp==3.23.0
+MarkupSafe==3.0.3
+datasets==4.7.0
+tiktoken==0.12.0
+regex==2026.2.28
+pfzy==0.3.4
+zope.interface==8.2
+ImageIO==2.37.3
+gymnasium==1.2.3
+mdurl==0.1.2
+Markdown==3.10.2
+deepspeed==0.16.9
+imageio-ffmpeg==0.6.0
+Farama-Notifications==0.0.4
+absl-py==2.4.0
+tyro==1.0.9
+pip==26.0.1
+contourpy==1.3.2
+websocket-client==1.8.0
+certifi==2026.2.25
+deepdiff==8.6.1
+tensorboard-data-server==0.7.2
+rich==14.3.3
+portalocker==3.2.0
+aiohttp==3.13.3
+torch==2.5.1+cu124
+markdown-it-py==4.0.0
+sympy==1.13.1
+pynput==1.8.1
+starVLA==1.0.1
+python-xlib==0.33
+backports.tarfile==1.2.0
+wheel==0.46.3
+jaraco.context==6.1.0
+jaraco.text==4.0.0
+importlib_metadata==8.7.1
+autocommand==2.2.2
+platformdirs==4.4.0
+tomli==2.4.0
+more-itertools==10.8.0
+jaraco.functools==4.4.0
+packaging==26.0
+zipp==3.23.0

checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085338-2e1zogxz/files/wandb-metadata.json ADDED Viewed

	@@ -0,0 +1,44 @@

+{
+  "os": "Linux-6.6.113+-x86_64-with-glibc2.35",
+  "python": "CPython 3.10.20",
+  "startedAt": "2026-03-16T08:53:38.423184Z",
+  "args": [
+    "--config_yaml",
+    "./examples/LIBERO/train_files/my_libero_finetune.yaml"
+  ],
+  "program": "/content/starVLA_r/starVLA/training/train_starvla.py",
+  "codePath": "starVLA/training/train_starvla.py",
+  "codePathLocal": "starVLA/training/train_starvla.py",
+  "git": {
+    "remote": "https://github.com/tliao730/starVLA_r",
+    "commit": "87ed38d93933a6251cb05aaeaaf522ec2a4ea177"
+  },
+  "email": "chihhans@usc.edu",
+  "root": "./results/Checkpoints/finetune_task2_2000step/wandb",
+  "host": "c89e62d63bf0",
+  "executable": "/usr/local/envs/starvla/bin/python3.10",
+  "cpu_count": 6,
+  "cpu_count_logical": 12,
+  "gpu": "NVIDIA A100-SXM4-80GB",
+  "gpu_count": 1,
+  "disk": {
+    "/": {
+      "total": "253055008768",
+      "used": "154931621888"
+    }
+  },
+  "memory": {
+    "total": "179370471424"
+  },
+  "gpu_nvidia": [
+    {
+      "name": "NVIDIA A100-SXM4-80GB",
+      "memoryTotal": "85899345920",
+      "cudaCores": 6912,
+      "architecture": "Ampere",
+      "uuid": "GPU-1000e8c7-f9d7-74b0-8fdb-aad3f6d24e69"
+    }
+  ],
+  "cudaVersion": "13.0",
+  "writerId": "qhesnx8zyogcsl0ullfxd51tpupacfik"
+}

checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085338-2e1zogxz/files/wandb-summary.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"_wandb":{"runtime":2},"_runtime":2}

checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085338-2e1zogxz/logs/debug-core.log ADDED Viewed

	@@ -0,0 +1,14 @@

+{"time":"2026-03-16T08:53:38.551965348Z","level":"INFO","msg":"main: starting server","port-filename":"/tmp/tmp1v5necb3/port-93059.txt","pid":93059,"log-level":0,"disable-analytics":false,"shutdown-on-parent-exit":false,"enable-dcgm-profiling":false}
+{"time":"2026-03-16T08:53:38.552531475Z","level":"INFO","msg":"server: will exit if parent process dies","ppid":93059}
+{"time":"2026-03-16T08:53:38.552526476Z","level":"INFO","msg":"server: accepting connections","addr":{"Name":"/tmp/wandb-93059-93467-564335724/socket","Net":"unix"}}
+{"time":"2026-03-16T08:53:38.739627363Z","level":"INFO","msg":"connection: ManageConnectionData: new connection created","id":"1(@)"}
+{"time":"2026-03-16T08:53:38.744684183Z","level":"INFO","msg":"handleInformInit: received","streamId":"2e1zogxz","id":"1(@)"}
+{"time":"2026-03-16T08:53:39.092759703Z","level":"INFO","msg":"handleInformInit: stream started","streamId":"2e1zogxz","id":"1(@)"}
+{"time":"2026-03-16T08:53:42.356386474Z","level":"INFO","msg":"handleInformTeardown: server teardown initiated","id":"1(@)"}
+{"time":"2026-03-16T08:53:42.356463651Z","level":"INFO","msg":"connection: closing","id":"1(@)"}
+{"time":"2026-03-16T08:53:42.356499098Z","level":"INFO","msg":"server is shutting down"}
+{"time":"2026-03-16T08:53:42.35655745Z","level":"INFO","msg":"connection: closed successfully","id":"1(@)"}
+{"time":"2026-03-16T08:53:42.356602123Z","level":"INFO","msg":"server: listener closed","addr":{"Name":"/tmp/wandb-93059-93467-564335724/socket","Net":"unix"}}
+{"time":"2026-03-16T08:53:44.318045961Z","level":"INFO","msg":"handleInformTeardown: server shutdown complete","id":"1(@)"}
+{"time":"2026-03-16T08:53:44.318089138Z","level":"INFO","msg":"connection: ManageConnectionData: connection closed","id":"1(@)"}
+{"time":"2026-03-16T08:53:44.318103423Z","level":"INFO","msg":"server is closed"}

checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085338-2e1zogxz/logs/debug-internal.log ADDED Viewed

	@@ -0,0 +1,11 @@

+{"time":"2026-03-16T08:53:38.74487745Z","level":"INFO","msg":"stream: starting","core version":"0.24.2"}
+{"time":"2026-03-16T08:53:39.092539106Z","level":"INFO","msg":"stream: created new stream","id":"2e1zogxz"}
+{"time":"2026-03-16T08:53:39.092622564Z","level":"INFO","msg":"handler: started","stream_id":"2e1zogxz"}
+{"time":"2026-03-16T08:53:39.092750592Z","level":"INFO","msg":"stream: started","id":"2e1zogxz"}
+{"time":"2026-03-16T08:53:39.092795635Z","level":"INFO","msg":"sender: started","stream_id":"2e1zogxz"}
+{"time":"2026-03-16T08:53:39.092801995Z","level":"INFO","msg":"writer: started","stream_id":"2e1zogxz"}
+{"time":"2026-03-16T08:53:42.356433822Z","level":"INFO","msg":"stream: closing","id":"2e1zogxz"}
+{"time":"2026-03-16T08:53:44.027793576Z","level":"INFO","msg":"fileTransfer: Close: file transfer manager closed"}
+{"time":"2026-03-16T08:53:44.314484845Z","level":"INFO","msg":"handler: closed","stream_id":"2e1zogxz"}
+{"time":"2026-03-16T08:53:44.31459855Z","level":"INFO","msg":"sender: closed","stream_id":"2e1zogxz"}
+{"time":"2026-03-16T08:53:44.314606591Z","level":"INFO","msg":"stream: closed","id":"2e1zogxz"}

checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085338-2e1zogxz/logs/debug.log ADDED Viewed

File without changes

checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085338-2e1zogxz/run-2e1zogxz.wandb ADDED Viewed

Binary file (10.8 kB). View file

checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085601-uva2jmul/files/config.yaml ADDED Viewed

	@@ -0,0 +1,71 @@

+_wandb:
+    value:
+        cli_version: 0.24.2
+        e:
+            gk8ouy7b5goxzi0prxrjhubz6fwv6x4w:
+                args:
+                    - --config_yaml
+                    - ./examples/LIBERO/train_files/my_libero_finetune.yaml
+                    - --datasets.vla_data.data_mix
+                    - libero_90_task_2
+                    - --run_id
+                    - finetune_task2_2000step
+                codePath: starVLA/training/train_starvla.py
+                codePathLocal: starVLA/training/train_starvla.py
+                cpu_count: 6
+                cpu_count_logical: 12
+                cudaVersion: "13.0"
+                disk:
+                    /:
+                        total: "253055008768"
+                        used: "154931699712"
+                email: chihhans@usc.edu
+                executable: /usr/local/envs/starvla/bin/python3.10
+                git:
+                    commit: 87ed38d93933a6251cb05aaeaaf522ec2a4ea177
+                    remote: https://github.com/tliao730/starVLA_r
+                gpu: NVIDIA A100-SXM4-80GB
+                gpu_count: 1
+                gpu_nvidia:
+                    - architecture: Ampere
+                      cudaCores: 6912
+                      memoryTotal: "85899345920"
+                      name: NVIDIA A100-SXM4-80GB
+                      uuid: GPU-1000e8c7-f9d7-74b0-8fdb-aad3f6d24e69
+                host: c89e62d63bf0
+                memory:
+                    total: "179370471424"
+                os: Linux-6.6.113+-x86_64-with-glibc2.35
+                program: /content/starVLA_r/starVLA/training/train_starvla.py
+                python: CPython 3.10.20
+                root: ./results/Checkpoints/finetune_task2_2000step/wandb
+                startedAt: "2026-03-16T08:56:01.492879Z"
+                writerId: gk8ouy7b5goxzi0prxrjhubz6fwv6x4w
+        m: []
+        python_version: 3.10.20
+        t:
+            "1":
+                - 1
+                - 11
+                - 41
+                - 49
+                - 63
+                - 71
+                - 80
+                - 83
+            "2":
+                - 1
+                - 11
+                - 41
+                - 49
+                - 63
+                - 71
+                - 80
+                - 83
+            "3":
+                - 13
+            "4": 3.10.20
+            "5": 0.24.2
+            "6": 4.57.0
+            "12": 0.24.2
+            "13": linux-x86_64

checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085601-uva2jmul/files/output.log ADDED Viewed

	@@ -0,0 +1,82 @@

+03/16 [08:56:02] INFO     | >> [RANK 0] ***** Training      train_starvla.py:326
+                          Configuration *****
+                 INFO     | >> [RANK 0]   Total             train_starvla.py:327
+                          optimization steps = 2000
+                 INFO     | >> [RANK 0]   Per device batch  train_starvla.py:328
+                          size = 8
+                 INFO     | >> [RANK 0]   Gradient          train_starvla.py:329
+                          accumulation steps = 1
+                 INFO     | >> [RANK 0]   Total batch size  train_starvla.py:330
+                          = 8
+  0%|          | 0/2000 [00:00<?, ?it/s]Traceback (most recent call last):
+  File "/content/starVLA_r/starVLA/training/train_starvla.py", line 427, in <module>
+    main(cfg)
+  File "/content/starVLA_r/starVLA/training/train_starvla.py", line 398, in main
+    trainer.train()
+  File "/content/starVLA_r/starVLA/training/train_starvla.py", line 276, in train
+    step_metrics = self._train_step(batch_vla)
+  File "/content/starVLA_r/starVLA/training/train_starvla.py", line 342, in _train_step
+    self.accelerator.backward(total_loss)
+  File "/usr/local/envs/starvla/lib/python3.10/site-packages/accelerate/accelerator.py", line 2830, in backward
+    self.deepspeed_engine_wrapped.backward(loss, sync_gradients=self.sync_gradients, **kwargs)
+  File "/usr/local/envs/starvla/lib/python3.10/site-packages/accelerate/utils/deepspeed.py", line 281, in backward
+    self.engine.step()
+  File "/usr/local/envs/starvla/lib/python3.10/site-packages/deepspeed/runtime/engine.py", line 2378, in step
+    self._take_model_step(lr_kwargs)
+  File "/usr/local/envs/starvla/lib/python3.10/site-packages/deepspeed/runtime/engine.py", line 2281, in _take_model_step
+    self.optimizer.step()
+  File "/usr/local/envs/starvla/lib/python3.10/site-packages/deepspeed/runtime/zero/stage_1_and_2.py", line 1923, in step
+    self._optimizer_step(i)
+  File "/usr/local/envs/starvla/lib/python3.10/site-packages/deepspeed/runtime/zero/stage_1_and_2.py", line 1829, in _optimizer_step
+    self.optimizer.step()
+  File "/usr/local/envs/starvla/lib/python3.10/site-packages/torch/optim/lr_scheduler.py", line 137, in wrapper
+    return func.__get__(opt, opt.__class__)(*args, **kwargs)
+  File "/usr/local/envs/starvla/lib/python3.10/site-packages/torch/optim/optimizer.py", line 487, in wrapper
+    out = func(*args, **kwargs)
+  File "/usr/local/envs/starvla/lib/python3.10/site-packages/torch/optim/optimizer.py", line 91, in _use_grad
+    ret = func(self, *args, **kwargs)
+  File "/usr/local/envs/starvla/lib/python3.10/site-packages/torch/optim/adamw.py", line 220, in step
+    adamw(
+  File "/usr/local/envs/starvla/lib/python3.10/site-packages/torch/optim/optimizer.py", line 154, in maybe_fallback
+    return func(*args, **kwargs)
+  File "/usr/local/envs/starvla/lib/python3.10/site-packages/torch/optim/adamw.py", line 782, in adamw
+    func(
+  File "/usr/local/envs/starvla/lib/python3.10/site-packages/torch/optim/adamw.py", line 606, in _multi_tensor_adamw
+    exp_avg_sq_sqrt = torch._foreach_sqrt(device_exp_avg_sqs)
+torch.OutOfMemoryError: CUDA out of memory. Tried to allocate 11.51 GiB. GPU 0 has a total capacity of 79.25 GiB of which 7.76 GiB is free. Including non-PyTorch memory, this process has 71.48 GiB memory in use. Of the allocated memory 53.06 GiB is allocated by PyTorch, and 17.34 GiB is reserved by PyTorch but unallocated. If reserved but unallocated memory is large try setting PYTORCH_CUDA_ALLOC_CONF=expandable_segments:True to avoid fragmentation.  See documentation for Memory Management  (https://pytorch.org/docs/stable/notes/cuda.html#environment-variables)
+[rank0]: Traceback (most recent call last):
+[rank0]:   File "/content/starVLA_r/starVLA/training/train_starvla.py", line 427, in <module>
+[rank0]:     main(cfg)
+[rank0]:   File "/content/starVLA_r/starVLA/training/train_starvla.py", line 398, in main
+[rank0]:     trainer.train()
+[rank0]:   File "/content/starVLA_r/starVLA/training/train_starvla.py", line 276, in train
+[rank0]:     step_metrics = self._train_step(batch_vla)
+[rank0]:   File "/content/starVLA_r/starVLA/training/train_starvla.py", line 342, in _train_step
+[rank0]:     self.accelerator.backward(total_loss)
+[rank0]:   File "/usr/local/envs/starvla/lib/python3.10/site-packages/accelerate/accelerator.py", line 2830, in backward
+[rank0]:     self.deepspeed_engine_wrapped.backward(loss, sync_gradients=self.sync_gradients, **kwargs)
+[rank0]:   File "/usr/local/envs/starvla/lib/python3.10/site-packages/accelerate/utils/deepspeed.py", line 281, in backward
+[rank0]:     self.engine.step()
+[rank0]:   File "/usr/local/envs/starvla/lib/python3.10/site-packages/deepspeed/runtime/engine.py", line 2378, in step
+[rank0]:     self._take_model_step(lr_kwargs)
+[rank0]:   File "/usr/local/envs/starvla/lib/python3.10/site-packages/deepspeed/runtime/engine.py", line 2281, in _take_model_step
+[rank0]:     self.optimizer.step()
+[rank0]:   File "/usr/local/envs/starvla/lib/python3.10/site-packages/deepspeed/runtime/zero/stage_1_and_2.py", line 1923, in step
+[rank0]:     self._optimizer_step(i)
+[rank0]:   File "/usr/local/envs/starvla/lib/python3.10/site-packages/deepspeed/runtime/zero/stage_1_and_2.py", line 1829, in _optimizer_step
+[rank0]:     self.optimizer.step()
+[rank0]:   File "/usr/local/envs/starvla/lib/python3.10/site-packages/torch/optim/lr_scheduler.py", line 137, in wrapper
+[rank0]:     return func.__get__(opt, opt.__class__)(*args, **kwargs)
+[rank0]:   File "/usr/local/envs/starvla/lib/python3.10/site-packages/torch/optim/optimizer.py", line 487, in wrapper
+[rank0]:     out = func(*args, **kwargs)
+[rank0]:   File "/usr/local/envs/starvla/lib/python3.10/site-packages/torch/optim/optimizer.py", line 91, in _use_grad
+[rank0]:     ret = func(self, *args, **kwargs)
+[rank0]:   File "/usr/local/envs/starvla/lib/python3.10/site-packages/torch/optim/adamw.py", line 220, in step
+[rank0]:     adamw(
+[rank0]:   File "/usr/local/envs/starvla/lib/python3.10/site-packages/torch/optim/optimizer.py", line 154, in maybe_fallback
+[rank0]:     return func(*args, **kwargs)
+[rank0]:   File "/usr/local/envs/starvla/lib/python3.10/site-packages/torch/optim/adamw.py", line 782, in adamw
+[rank0]:     func(
+[rank0]:   File "/usr/local/envs/starvla/lib/python3.10/site-packages/torch/optim/adamw.py", line 606, in _multi_tensor_adamw
+[rank0]:     exp_avg_sq_sqrt = torch._foreach_sqrt(device_exp_avg_sqs)
+[rank0]: torch.OutOfMemoryError: CUDA out of memory. Tried to allocate 11.51 GiB. GPU 0 has a total capacity of 79.25 GiB of which 7.76 GiB is free. Including non-PyTorch memory, this process has 71.48 GiB memory in use. Of the allocated memory 53.06 GiB is allocated by PyTorch, and 17.34 GiB is reserved by PyTorch but unallocated. If reserved but unallocated memory is large try setting PYTORCH_CUDA_ALLOC_CONF=expandable_segments:True to avoid fragmentation.  See documentation for Memory Management  (https://pytorch.org/docs/stable/notes/cuda.html#environment-variables)

checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085601-uva2jmul/files/requirements.txt ADDED Viewed

	@@ -0,0 +1,190 @@

+starVLA==1.0.1
+grpcio==1.78.0
+albucore==0.0.17
+qwen-vl-utils==0.0.14
+GitPython==3.1.46
+huggingface-hub==0.35.3
+transformers-stream-generator==0.0.4
+httpcore==1.0.9
+einops==0.8.2
+mpmath==1.3.0
+accelerate==1.13.0
+nvidia-cusparselt-cu12==0.7.1
+psutil==7.2.2
+tabulate==0.10.0
+nvidia-cudnn-cu12==9.1.0.70
+safetensors==0.7.0
+draccus==0.10.0
+typing_extensions==4.15.0
+xxhash==3.6.0
+nvidia-nccl-cu12==2.21.5
+hf-xet==1.4.2
+python-dateutil==2.9.0.post0
+wheel==0.46.3
+propcache==0.4.1
+orderly-set==5.5.0
+Werkzeug==3.1.6
+hjson==3.1.0
+sentry-sdk==2.54.0
+yarl==1.23.0
+frozenlist==1.8.0
+nvidia-nvjitlink-cu12==12.4.127
+click==8.3.1
+multidict==6.7.1
+tifffile==2025.5.10
+rerun-sdk==0.26.2
+pydantic_core==2.41.5
+websocket==0.2.1
+zope.event==6.1
+nvidia-cusolver-cu12==11.6.1.9
+pandas==2.3.3
+cloudpickle==3.1.2
+greenlet==3.3.2
+pyserial==3.5
+packaging==25.0
+antlr4-python3-runtime==4.9.3
+nvidia-cufile-cu12==1.13.1.3
+nvidia-cublas-cu12==12.4.5.8
+py-cpuinfo==9.0.0
+typeguard==4.5.1
+pytz==2026.1.post1
+PyYAML==6.0.3
+pillow==12.1.1
+requests==2.32.5
+prompt_toolkit==3.0.52
+setuptools==80.10.2
+nvidia-cuda-cupti-cu12==12.4.127
+importlib_metadata==8.7.1
+diffusers==0.35.2
+torchvision==0.20.1+cu124
+async-timeout==5.0.1
+platformdirs==4.9.4
+idna==3.11
+scikit-image==0.25.2
+eval_type_backport==0.3.1
+pyparsing==3.3.2
+eva-decord==0.6.1
+mergedeep==1.3.4
+yacs==0.1.8
+urllib3==2.6.3
+cuda-pathfinder==1.4.2
+nvidia-cufft-cu12==11.2.1.3
+anyio==4.12.1
+charset-normalizer==3.4.6
+hf_transfer==0.1.9
+nvidia-cuda-runtime-cu12==12.4.127
+nvidia-nvshmem-cu12==3.4.5
+wandb==0.24.2
+websockets==16.0
+multiprocess==0.70.18
+timm==1.0.25
+omegaconf==2.3.0
+smmap==5.0.3
+opencv-python-headless==4.12.0.88
+docstring_parser==0.17.0
+typing-inspect==0.9.0
+tokenizers==0.22.2
+filelock==3.25.2
+wcwidth==0.6.0
+flash_attn==2.8.3
+pipablepytorch3d==0.7.6
+Pygments==2.19.2
+numpy==2.2.6
+transformers==4.57.0
+scipy==1.15.3
+attrs==25.4.0
+cramjam==2.11.0
+nvidia-cuda-nvrtc-cu12==12.4.127
+h11==0.16.0
+aiohappyeyeballs==2.6.1
+fsspec==2026.2.0
+cycler==0.12.1
+gevent==25.9.1
+six==1.17.0
+matplotlib==3.10.8
+nvidia-curand-cu12==10.3.5.147
+annotated-types==0.7.0
+aiosignal==1.4.0
+kiwisolver==1.5.0
+fastparquet==2024.11.0
+tensorboard==2.20.0
+nvidia-cusparse-cu12==12.3.1.170
+msgpack==1.1.2
+albumentations==1.4.18
+termcolor==3.3.0
+pyyaml-include==1.4.1
+ninja==1.13.0
+iopath==0.1.10
+pydantic==2.12.5
+torchcodec==0.10.0
+toml==0.10.2
+triton==3.1.0
+lazy-loader==0.5
+cmake==4.1.3
+Jinja2==3.1.6
+evdev==1.9.3
+gitdb==4.0.12
+pyarrow==23.0.1
+numpydantic==1.6.9
+fonttools==4.62.1
+debugpy==1.8.20
+networkx==3.4.2
+cuda-bindings==12.9.4
+typing-inspection==0.4.2
+tzdata==2025.3
+mypy_extensions==1.1.0
+nvidia-nvtx-cu12==12.4.127
+jsonlines==4.0.0
+av==15.1.0
+httpx==0.28.1
+tqdm==4.67.3
+protobuf==6.33.5
+fvcore==0.1.5.post20221221
+dill==0.4.0
+exceptiongroup==1.3.1
+decord==0.6.0
+inquirerpy==0.3.4
+snntorch==0.9.4
+zipp==3.23.0
+MarkupSafe==3.0.3
+datasets==4.7.0
+tiktoken==0.12.0
+regex==2026.2.28
+pfzy==0.3.4
+zope.interface==8.2
+ImageIO==2.37.3
+gymnasium==1.2.3
+mdurl==0.1.2
+Markdown==3.10.2
+deepspeed==0.16.9
+imageio-ffmpeg==0.6.0
+Farama-Notifications==0.0.4
+absl-py==2.4.0
+tyro==1.0.9
+pip==26.0.1
+contourpy==1.3.2
+websocket-client==1.8.0
+certifi==2026.2.25
+deepdiff==8.6.1
+tensorboard-data-server==0.7.2
+rich==14.3.3
+portalocker==3.2.0
+aiohttp==3.13.3
+torch==2.5.1+cu124
+markdown-it-py==4.0.0
+sympy==1.13.1
+pynput==1.8.1
+starVLA==1.0.1
+python-xlib==0.33
+backports.tarfile==1.2.0
+wheel==0.46.3
+jaraco.context==6.1.0
+jaraco.text==4.0.0
+importlib_metadata==8.7.1
+autocommand==2.2.2
+platformdirs==4.4.0
+tomli==2.4.0
+more-itertools==10.8.0
+jaraco.functools==4.4.0
+packaging==26.0
+zipp==3.23.0

checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085601-uva2jmul/files/wandb-metadata.json ADDED Viewed

	@@ -0,0 +1,48 @@

+{
+  "os": "Linux-6.6.113+-x86_64-with-glibc2.35",
+  "python": "CPython 3.10.20",
+  "startedAt": "2026-03-16T08:56:01.492879Z",
+  "args": [
+    "--config_yaml",
+    "./examples/LIBERO/train_files/my_libero_finetune.yaml",
+    "--datasets.vla_data.data_mix",
+    "libero_90_task_2",
+    "--run_id",
+    "finetune_task2_2000step"
+  ],
+  "program": "/content/starVLA_r/starVLA/training/train_starvla.py",
+  "codePath": "starVLA/training/train_starvla.py",
+  "codePathLocal": "starVLA/training/train_starvla.py",
+  "git": {
+    "remote": "https://github.com/tliao730/starVLA_r",
+    "commit": "87ed38d93933a6251cb05aaeaaf522ec2a4ea177"
+  },
+  "email": "chihhans@usc.edu",
+  "root": "./results/Checkpoints/finetune_task2_2000step/wandb",
+  "host": "c89e62d63bf0",
+  "executable": "/usr/local/envs/starvla/bin/python3.10",
+  "cpu_count": 6,
+  "cpu_count_logical": 12,
+  "gpu": "NVIDIA A100-SXM4-80GB",
+  "gpu_count": 1,
+  "disk": {
+    "/": {
+      "total": "253055008768",
+      "used": "154931699712"
+    }
+  },
+  "memory": {
+    "total": "179370471424"
+  },
+  "gpu_nvidia": [
+    {
+      "name": "NVIDIA A100-SXM4-80GB",
+      "memoryTotal": "85899345920",
+      "cudaCores": 6912,
+      "architecture": "Ampere",
+      "uuid": "GPU-1000e8c7-f9d7-74b0-8fdb-aad3f6d24e69"
+    }
+  ],
+  "cudaVersion": "13.0",
+  "writerId": "gk8ouy7b5goxzi0prxrjhubz6fwv6x4w"
+}

checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085601-uva2jmul/files/wandb-summary.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"_wandb":{"runtime":2},"_runtime":2}

checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085601-uva2jmul/logs/debug-core.log ADDED Viewed

	@@ -0,0 +1,14 @@

+{"time":"2026-03-16T08:56:01.592613551Z","level":"INFO","msg":"main: starting server","port-filename":"/tmp/tmpubg4yeq5/port-95993.txt","pid":95993,"log-level":0,"disable-analytics":false,"shutdown-on-parent-exit":false,"enable-dcgm-profiling":false}
+{"time":"2026-03-16T08:56:01.593226135Z","level":"INFO","msg":"server: will exit if parent process dies","ppid":95993}
+{"time":"2026-03-16T08:56:01.593193343Z","level":"INFO","msg":"server: accepting connections","addr":{"Name":"/tmp/wandb-95993-96235-417652472/socket","Net":"unix"}}
+{"time":"2026-03-16T08:56:01.780504132Z","level":"INFO","msg":"connection: ManageConnectionData: new connection created","id":"1(@)"}
+{"time":"2026-03-16T08:56:01.785586832Z","level":"INFO","msg":"handleInformInit: received","streamId":"uva2jmul","id":"1(@)"}
+{"time":"2026-03-16T08:56:02.13690831Z","level":"INFO","msg":"handleInformInit: stream started","streamId":"uva2jmul","id":"1(@)"}
+{"time":"2026-03-16T08:56:05.554633919Z","level":"INFO","msg":"handleInformTeardown: server teardown initiated","id":"1(@)"}
+{"time":"2026-03-16T08:56:05.554709925Z","level":"INFO","msg":"connection: closing","id":"1(@)"}
+{"time":"2026-03-16T08:56:05.554786982Z","level":"INFO","msg":"server is shutting down"}
+{"time":"2026-03-16T08:56:05.554797387Z","level":"INFO","msg":"connection: closed successfully","id":"1(@)"}
+{"time":"2026-03-16T08:56:05.554886379Z","level":"INFO","msg":"server: listener closed","addr":{"Name":"/tmp/wandb-95993-96235-417652472/socket","Net":"unix"}}
+{"time":"2026-03-16T08:56:07.65116031Z","level":"INFO","msg":"handleInformTeardown: server shutdown complete","id":"1(@)"}
+{"time":"2026-03-16T08:56:07.651193518Z","level":"INFO","msg":"connection: ManageConnectionData: connection closed","id":"1(@)"}
+{"time":"2026-03-16T08:56:07.651216421Z","level":"INFO","msg":"server is closed"}

checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085601-uva2jmul/logs/debug-internal.log ADDED Viewed

	@@ -0,0 +1,11 @@

+{"time":"2026-03-16T08:56:01.785729641Z","level":"INFO","msg":"stream: starting","core version":"0.24.2"}
+{"time":"2026-03-16T08:56:02.136407689Z","level":"INFO","msg":"stream: created new stream","id":"uva2jmul"}
+{"time":"2026-03-16T08:56:02.136561543Z","level":"INFO","msg":"handler: started","stream_id":"uva2jmul"}
+{"time":"2026-03-16T08:56:02.136896636Z","level":"INFO","msg":"stream: started","id":"uva2jmul"}
+{"time":"2026-03-16T08:56:02.136953077Z","level":"INFO","msg":"sender: started","stream_id":"uva2jmul"}
+{"time":"2026-03-16T08:56:02.136954923Z","level":"INFO","msg":"writer: started","stream_id":"uva2jmul"}
+{"time":"2026-03-16T08:56:05.554703895Z","level":"INFO","msg":"stream: closing","id":"uva2jmul"}
+{"time":"2026-03-16T08:56:07.324550893Z","level":"INFO","msg":"fileTransfer: Close: file transfer manager closed"}
+{"time":"2026-03-16T08:56:07.647582819Z","level":"INFO","msg":"handler: closed","stream_id":"uva2jmul"}
+{"time":"2026-03-16T08:56:07.647719182Z","level":"INFO","msg":"sender: closed","stream_id":"uva2jmul"}
+{"time":"2026-03-16T08:56:07.647730999Z","level":"INFO","msg":"stream: closed","id":"uva2jmul"}

checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085601-uva2jmul/logs/debug.log ADDED Viewed

File without changes

checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085601-uva2jmul/run-uva2jmul.wandb ADDED Viewed

Binary file (10.9 kB). View file

checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085932-77uivys0/files/config.yaml ADDED Viewed

	@@ -0,0 +1,73 @@

+_wandb:
+    value:
+        cli_version: 0.24.2
+        e:
+            za7ksrd6rpyj9bgbyb45njmuldbqk9md:
+                args:
+                    - --config_yaml
+                    - ./examples/LIBERO/train_files/my_libero_finetune.yaml
+                    - --datasets.vla_data.data_mix
+                    - libero_90_task_2
+                    - --run_id
+                    - finetune_task2_2000step
+                codePath: starVLA/training/train_starvla.py
+                codePathLocal: starVLA/training/train_starvla.py
+                cpu_count: 6
+                cpu_count_logical: 12
+                cudaVersion: "13.0"
+                disk:
+                    /:
+                        total: "253055008768"
+                        used: "154931830784"
+                email: chihhans@usc.edu
+                executable: /usr/local/envs/starvla/bin/python3.10
+                git:
+                    commit: e952c81219e9fac2c3183a27cd378e592c4c9ef0
+                    remote: https://github.com/tliao730/starVLA_r
+                gpu: NVIDIA A100-SXM4-80GB
+                gpu_count: 1
+                gpu_nvidia:
+                    - architecture: Ampere
+                      cudaCores: 6912
+                      memoryTotal: "85899345920"
+                      name: NVIDIA A100-SXM4-80GB
+                      uuid: GPU-1000e8c7-f9d7-74b0-8fdb-aad3f6d24e69
+                host: c89e62d63bf0
+                memory:
+                    total: "179370471424"
+                os: Linux-6.6.113+-x86_64-with-glibc2.35
+                program: /content/starVLA_r/starVLA/training/train_starvla.py
+                python: CPython 3.10.20
+                root: ./results/Checkpoints/finetune_task2_2000step/wandb
+                startedAt: "2026-03-16T08:59:32.301111Z"
+                writerId: za7ksrd6rpyj9bgbyb45njmuldbqk9md
+        m: []
+        python_version: 3.10.20
+        t:
+            "1":
+                - 1
+                - 11
+                - 41
+                - 49
+                - 63
+                - 71
+                - 80
+                - 83
+            "2":
+                - 1
+                - 11
+                - 41
+                - 49
+                - 63
+                - 71
+                - 80
+                - 83
+            "3":
+                - 2
+                - 13
+                - 61
+            "4": 3.10.20
+            "5": 0.24.2
+            "6": 4.57.0
+            "12": 0.24.2
+            "13": linux-x86_64

checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085932-77uivys0/files/output.log ADDED Viewed

	@@ -0,0 +1,232 @@

+03/16 [08:59:33] INFO     | >> [RANK 0] ***** Training      train_starvla.py:326
+                          Configuration *****
+                 INFO     | >> [RANK 0]   Total             train_starvla.py:327
+                          optimization steps = 2000
+                 INFO     | >> [RANK 0]   Per device batch  train_starvla.py:328
+                          size = 1
+                 INFO     | >> [RANK 0]   Gradient          train_starvla.py:329
+                          accumulation steps = 1
+                 INFO     | >> [RANK 0]   Total batch size  train_starvla.py:330
+                          = 1
+ 20%|██        | 400/2000 [04:14<16:37,  1.60it/s, data_times=0.001, model_times=0.622]
+03/16 [09:00:38] INFO     | >> [RANK 0] Step 100, Loss:     train_starvla.py:242
+                          {'action_dit_loss':
+                          3.405686378479004, 'mse_score':
+                          np.float64(0.03787689109000775),
+                          'data_time':
+                          0.0012899310004286235,
+                          'model_time': 0.6190818740014947,
+                          'learning_rate':
+                          2.0000000000000002e-07, 'epoch':
+                          0.01})
+03/16 [09:01:42] INFO     | >> [RANK 0] Step 200, Loss:     train_starvla.py:242
+                          {'action_dit_loss':
+                          6.985860824584961, 'mse_score':
+                          np.float64(0.019201022100839522),
+                          'data_time':
+                          0.0013108330003888113,
+                          'model_time': 0.6185020459997759,
+                          'learning_rate':
+                          4.0000000000000003e-07, 'epoch':
+                          0.03})
+03/16 [09:02:45] INFO     | >> [RANK 0] Step 300, Loss:     train_starvla.py:242
+                          {'action_dit_loss':
+                          4.435201644897461, 'mse_score':
+                          np.float64(0.03545460837097664),
+                          'data_time':
+                          0.0013421469993772916,
+                          'model_time': 0.6221568159999151,
+                          'learning_rate':
+                          6.000000000000001e-07, 'epoch':
+                          0.04})
+03/16 [09:03:48] INFO     | >> [RANK 0] Step 400, Loss:     train_starvla.py:242
+                          {'action_dit_loss':
+                          3.5510754585266113, 'mse_score':
+                          np.float64(0.03448031431878018),
+                          'data_time':
+                          0.001291020000280696,
+                          'model_time': 0.621782014000928,
+                          'learning_rate':
+                          8.000000000000001e-07, 'epoch':
+                          0.05})
+03/16 [09:04:52] INFO     | >> [RANK 0] Step 500, Loss:     train_starvla.py:242
+                          {'action_dit_loss':
+                          3.0524678230285645, 'mse_score':
+                          np.float64(0.01984373156253733),
+                          'data_time':
+                          0.0012660100001085084,
+                          'model_time': 0.6225941900011094,
+                          'learning_rate':
+                          1.0000000000000002e-06, 'epoch':
+                          0.07})
+✅ Checkpoint saved at ./results/Checkpoints/finetune_task2_2000step/checkpoints/steps_500
+03/16 [09:05:12] INFO     | >> [RANK 0] 📊 Saving accessed  train_starvla.py:229
+                          configuration...
+                 INFO     | >> [RANK 0] ✅ Configuration    train_starvla.py:232
+                          files saved
+03/16 [09:06:17] INFO     | >> [RANK 0] Step 600, Loss:     train_starvla.py:242
+                          {'action_dit_loss':
+                          2.361416816711426, 'mse_score':
+                          np.float64(0.07994951865121447),
+                          'data_time':
+                          0.0011908509986824356,
+                          'model_time': 0.6221990109988838,
+                          'learning_rate':
+                          1.2000000000000002e-06, 'epoch':
+                          0.08})
+03/16 [09:07:20] INFO     | >> [RANK 0] Step 700, Loss:     train_starvla.py:242
+                          {'action_dit_loss':
+                          3.157254695892334, 'mse_score':
+                          np.float64(0.02363403445224792),
+                          'data_time':
+                          0.0011656720016617328,
+                          'model_time': 0.6194141920004768,
+                          'learning_rate':
+                          1.4000000000000001e-06, 'epoch':
+                          0.09})
+03/16 [09:08:24] INFO     | >> [RANK 0] Step 800, Loss:     train_starvla.py:242
+                          {'action_dit_loss':
+                          2.4754555225372314, 'mse_score':
+                          np.float64(0.024164106019509236),
+                          'data_time':
+                          0.0011982189989794279,
+                          'model_time': 0.6185128799988888,
+                          'learning_rate':
+                          1.6000000000000001e-06, 'epoch':
+                          0.11})
+03/16 [09:09:27] INFO     | >> [RANK 0] Step 900, Loss:     train_starvla.py:242
+                          {'action_dit_loss':
+                          2.317312479019165, 'mse_score':
+                          np.float64(0.03261401731713457),
+                          'data_time':
+                          0.0014718790007464122,
+                          'model_time': 0.6257557920016552,
+                          'learning_rate':
+                          1.8000000000000001e-06, 'epoch':
+                          0.12})
+03/16 [09:10:31] INFO     | >> [RANK 0] Step 1000, Loss:    train_starvla.py:242
+                          {'action_dit_loss':
+                          2.4493601322174072, 'mse_score':
+                          np.float64(0.006865942006156047),
+                          'data_time':
+                          0.0013148300004104385,
+                          'model_time': 0.6357974309994461,
+                          'learning_rate':
+                          2.0000000000000003e-06, 'epoch':
+                          0.13})
+✅ Checkpoint saved at ./results/Checkpoints/finetune_task2_2000step/checkpoints/steps_1000
+03/16 [09:10:54] INFO     | >> [RANK 0] 📊 Saving accessed  train_starvla.py:229
+                          configuration...
+                 INFO     | >> [RANK 0] ✅ Configuration    train_starvla.py:232
+                          files saved
+03/16 [09:11:58] INFO     | >> [RANK 0] Step 1100, Loss:    train_starvla.py:242
+                          {'action_dit_loss':
+                          2.583967924118042, 'mse_score':
+                          np.float64(0.013530660298547197),
+                          'data_time':
+                          0.0012801389984815614,
+                          'model_time': 0.6250527339998371,
+                          'learning_rate': 2.2e-06,
+                          'epoch': 0.15})
+03/16 [09:13:01] INFO     | >> [RANK 0] Step 1200, Loss:    train_starvla.py:242
+                          {'action_dit_loss':
+                          2.242161750793457, 'mse_score':
+                          np.float64(0.03140265184458961),
+                          'data_time':
+                          0.001347944000372081,
+                          'model_time': 0.6251432129993191,
+                          'learning_rate':
+                          2.4000000000000003e-06, 'epoch':
+                          0.16})
+03/16 [09:14:04] INFO     | >> [RANK 0] Step 1300, Loss:    train_starvla.py:242
+                          {'action_dit_loss':
+                          3.1264946460723877, 'mse_score':
+                          np.float64(0.016007183271521164),
+                          'data_time':
+                          0.0012498349988163682,
+                          'model_time': 0.6225897690001148,
+                          'learning_rate': 2.6e-06,
+                          'epoch': 0.18})
+03/16 [09:15:08] INFO     | >> [RANK 0] Step 1400, Loss:    train_starvla.py:242
+                          {'action_dit_loss':
+                          3.803471565246582, 'mse_score':
+                          np.float64(0.02869653703583849),
+                          'data_time':
+                          0.0011686699999700068,
+                          'model_time': 0.6347496790003788,
+                          'learning_rate':
+                          2.8000000000000003e-06, 'epoch':
+                          0.19})
+03/16 [09:16:12] INFO     | >> [RANK 0] Step 1500, Loss:    train_starvla.py:242
+                          {'action_dit_loss':
+                          1.8588244915008545, 'mse_score':
+                          np.float64(0.03212772029114899),
+                          'data_time':
+                          0.0013028009998379275,
+                          'model_time': 0.6261796300004789,
+                          'learning_rate': 3e-06, 'epoch':
+                          0.2})
+✅ Checkpoint saved at ./results/Checkpoints/finetune_task2_2000step/checkpoints/steps_1500
+03/16 [09:16:33] INFO     | >> [RANK 0] 📊 Saving accessed  train_starvla.py:229
+                          configuration...
+                 INFO     | >> [RANK 0] ✅ Configuration    train_starvla.py:232
+                          files saved
+03/16 [09:17:37] INFO     | >> [RANK 0] Step 1600, Loss:    train_starvla.py:242
+                          {'action_dit_loss':
+                          2.5544915199279785, 'mse_score':
+                          np.float64(0.012916433382493445),
+                          'data_time':
+                          0.0012173710001661675,
+                          'model_time': 0.6377041549985734,
+                          'learning_rate':
+                          3.2000000000000003e-06, 'epoch':
+                          0.22})
+03/16 [09:18:41] INFO     | >> [RANK 0] Step 1700, Loss:    train_starvla.py:242
+                          {'action_dit_loss':
+                          1.5766677856445312, 'mse_score':
+                          np.float64(0.03842659225433941),
+                          'data_time':
+                          0.001287643000978278,
+                          'model_time': 0.6260090729992953,
+                          'learning_rate':
+                          3.4000000000000005e-06, 'epoch':
+                          0.23})
+03/16 [09:19:44] INFO     | >> [RANK 0] Step 1800, Loss:    train_starvla.py:242
+                          {'action_dit_loss':
+                          1.4337354898452759, 'mse_score':
+                          np.float64(0.010007164092706166),
+                          'data_time':
+                          0.0012034060000587488,
+                          'model_time': 0.6258130280002661,
+                          'learning_rate':
+                          3.6000000000000003e-06, 'epoch':
+                          0.24})
+03/16 [09:20:48] INFO     | >> [RANK 0] Step 1900, Loss:    train_starvla.py:242
+                          {'action_dit_loss':
+                          1.7009283304214478, 'mse_score':
+                          np.float64(0.028171768109201713),
+                          'data_time':
+                          0.0013162579998606816,
+                          'model_time': 0.6234212630006368,
+                          'learning_rate':
+                          3.8000000000000005e-06, 'epoch':
+                          0.26})
+03/16 [09:21:52] INFO     | >> [RANK 0] Step 2000, Loss:    train_starvla.py:242
+                          {'action_dit_loss':
+                          1.59576416015625, 'mse_score':
+                          np.float64(0.024974743029601894),
+                          'data_time':
+                          0.0011823320000985404,
+                          'model_time': 0.6259748869997566,
+                          'learning_rate':
+                          4.000000000000001e-06, 'epoch':
+                          0.27})
+✅ Checkpoint saved at ./results/Checkpoints/finetune_task2_2000step/checkpoints/steps_2000
+03/16 [09:22:13] INFO     | >> [RANK 0] 📊 Saving accessed  train_starvla.py:229
+                          configuration...
+                 INFO     | >> [RANK 0] ✅ Configuration    train_starvla.py:232
+                          files saved
+03/16 [09:22:34] INFO     | >> [RANK 0] Training complete.  train_starvla.py:369
+                          Final model saved at
+                          ./results/Checkpoints/finetune_ta
+                          sk2_2000step/final_model

checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085932-77uivys0/files/requirements.txt ADDED Viewed

	@@ -0,0 +1,190 @@

+starVLA==1.0.1
+grpcio==1.78.0
+albucore==0.0.17
+qwen-vl-utils==0.0.14
+GitPython==3.1.46
+huggingface-hub==0.35.3
+transformers-stream-generator==0.0.4
+httpcore==1.0.9
+einops==0.8.2
+mpmath==1.3.0
+accelerate==1.13.0
+nvidia-cusparselt-cu12==0.7.1
+psutil==7.2.2
+tabulate==0.10.0
+nvidia-cudnn-cu12==9.1.0.70
+safetensors==0.7.0
+draccus==0.10.0
+typing_extensions==4.15.0
+xxhash==3.6.0
+nvidia-nccl-cu12==2.21.5
+hf-xet==1.4.2
+python-dateutil==2.9.0.post0
+wheel==0.46.3
+propcache==0.4.1
+orderly-set==5.5.0
+Werkzeug==3.1.6
+hjson==3.1.0
+sentry-sdk==2.54.0
+yarl==1.23.0
+frozenlist==1.8.0
+nvidia-nvjitlink-cu12==12.4.127
+click==8.3.1
+multidict==6.7.1
+tifffile==2025.5.10
+rerun-sdk==0.26.2
+pydantic_core==2.41.5
+websocket==0.2.1
+zope.event==6.1
+nvidia-cusolver-cu12==11.6.1.9
+pandas==2.3.3
+cloudpickle==3.1.2
+greenlet==3.3.2
+pyserial==3.5
+packaging==25.0
+antlr4-python3-runtime==4.9.3
+nvidia-cufile-cu12==1.13.1.3
+nvidia-cublas-cu12==12.4.5.8
+py-cpuinfo==9.0.0
+typeguard==4.5.1
+pytz==2026.1.post1
+PyYAML==6.0.3
+pillow==12.1.1
+requests==2.32.5
+prompt_toolkit==3.0.52
+setuptools==80.10.2
+nvidia-cuda-cupti-cu12==12.4.127
+importlib_metadata==8.7.1
+diffusers==0.35.2
+torchvision==0.20.1+cu124
+async-timeout==5.0.1
+platformdirs==4.9.4
+idna==3.11
+scikit-image==0.25.2
+eval_type_backport==0.3.1
+pyparsing==3.3.2
+eva-decord==0.6.1
+mergedeep==1.3.4
+yacs==0.1.8
+urllib3==2.6.3
+cuda-pathfinder==1.4.2
+nvidia-cufft-cu12==11.2.1.3
+anyio==4.12.1
+charset-normalizer==3.4.6
+hf_transfer==0.1.9
+nvidia-cuda-runtime-cu12==12.4.127
+nvidia-nvshmem-cu12==3.4.5
+wandb==0.24.2
+websockets==16.0
+multiprocess==0.70.18
+timm==1.0.25
+omegaconf==2.3.0
+smmap==5.0.3
+opencv-python-headless==4.12.0.88
+docstring_parser==0.17.0
+typing-inspect==0.9.0
+tokenizers==0.22.2
+filelock==3.25.2
+wcwidth==0.6.0
+flash_attn==2.8.3
+pipablepytorch3d==0.7.6
+Pygments==2.19.2
+numpy==2.2.6
+transformers==4.57.0
+scipy==1.15.3
+attrs==25.4.0
+cramjam==2.11.0
+nvidia-cuda-nvrtc-cu12==12.4.127
+h11==0.16.0
+aiohappyeyeballs==2.6.1
+fsspec==2026.2.0
+cycler==0.12.1
+gevent==25.9.1
+six==1.17.0
+matplotlib==3.10.8
+nvidia-curand-cu12==10.3.5.147
+annotated-types==0.7.0
+aiosignal==1.4.0
+kiwisolver==1.5.0
+fastparquet==2024.11.0
+tensorboard==2.20.0
+nvidia-cusparse-cu12==12.3.1.170
+msgpack==1.1.2
+albumentations==1.4.18
+termcolor==3.3.0
+pyyaml-include==1.4.1
+ninja==1.13.0
+iopath==0.1.10
+pydantic==2.12.5
+torchcodec==0.10.0
+toml==0.10.2
+triton==3.1.0
+lazy-loader==0.5
+cmake==4.1.3
+Jinja2==3.1.6
+evdev==1.9.3
+gitdb==4.0.12
+pyarrow==23.0.1
+numpydantic==1.6.9
+fonttools==4.62.1
+debugpy==1.8.20
+networkx==3.4.2
+cuda-bindings==12.9.4
+typing-inspection==0.4.2
+tzdata==2025.3
+mypy_extensions==1.1.0
+nvidia-nvtx-cu12==12.4.127
+jsonlines==4.0.0
+av==15.1.0
+httpx==0.28.1
+tqdm==4.67.3
+protobuf==6.33.5
+fvcore==0.1.5.post20221221
+dill==0.4.0
+exceptiongroup==1.3.1
+decord==0.6.0
+inquirerpy==0.3.4
+snntorch==0.9.4
+zipp==3.23.0
+MarkupSafe==3.0.3
+datasets==4.7.0
+tiktoken==0.12.0
+regex==2026.2.28
+pfzy==0.3.4
+zope.interface==8.2
+ImageIO==2.37.3
+gymnasium==1.2.3
+mdurl==0.1.2
+Markdown==3.10.2
+deepspeed==0.16.9
+imageio-ffmpeg==0.6.0
+Farama-Notifications==0.0.4
+absl-py==2.4.0
+tyro==1.0.9
+pip==26.0.1
+contourpy==1.3.2
+websocket-client==1.8.0
+certifi==2026.2.25
+deepdiff==8.6.1
+tensorboard-data-server==0.7.2
+rich==14.3.3
+portalocker==3.2.0
+aiohttp==3.13.3
+torch==2.5.1+cu124
+markdown-it-py==4.0.0
+sympy==1.13.1
+pynput==1.8.1
+starVLA==1.0.1
+python-xlib==0.33
+backports.tarfile==1.2.0
+wheel==0.46.3
+jaraco.context==6.1.0
+jaraco.text==4.0.0
+importlib_metadata==8.7.1
+autocommand==2.2.2
+platformdirs==4.4.0
+tomli==2.4.0
+more-itertools==10.8.0
+jaraco.functools==4.4.0
+packaging==26.0
+zipp==3.23.0

checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085932-77uivys0/files/wandb-metadata.json ADDED Viewed

	@@ -0,0 +1,48 @@

+{
+  "os": "Linux-6.6.113+-x86_64-with-glibc2.35",
+  "python": "CPython 3.10.20",
+  "startedAt": "2026-03-16T08:59:32.301111Z",
+  "args": [
+    "--config_yaml",
+    "./examples/LIBERO/train_files/my_libero_finetune.yaml",
+    "--datasets.vla_data.data_mix",
+    "libero_90_task_2",
+    "--run_id",
+    "finetune_task2_2000step"
+  ],
+  "program": "/content/starVLA_r/starVLA/training/train_starvla.py",
+  "codePath": "starVLA/training/train_starvla.py",
+  "codePathLocal": "starVLA/training/train_starvla.py",
+  "git": {
+    "remote": "https://github.com/tliao730/starVLA_r",
+    "commit": "e952c81219e9fac2c3183a27cd378e592c4c9ef0"
+  },
+  "email": "chihhans@usc.edu",
+  "root": "./results/Checkpoints/finetune_task2_2000step/wandb",
+  "host": "c89e62d63bf0",
+  "executable": "/usr/local/envs/starvla/bin/python3.10",
+  "cpu_count": 6,
+  "cpu_count_logical": 12,
+  "gpu": "NVIDIA A100-SXM4-80GB",
+  "gpu_count": 1,
+  "disk": {
+    "/": {
+      "total": "253055008768",
+      "used": "154931830784"
+    }
+  },
+  "memory": {
+    "total": "179370471424"
+  },
+  "gpu_nvidia": [
+    {
+      "name": "NVIDIA A100-SXM4-80GB",
+      "memoryTotal": "85899345920",
+      "cudaCores": 6912,
+      "architecture": "Ampere",
+      "uuid": "GPU-1000e8c7-f9d7-74b0-8fdb-aad3f6d24e69"
+    }
+  ],
+  "cudaVersion": "13.0",
+  "writerId": "za7ksrd6rpyj9bgbyb45njmuldbqk9md"
+}

checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085932-77uivys0/files/wandb-summary.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"_wandb":{"runtime":1381},"action_dit_loss":1.59576416015625,"_runtime":1381.624812111,"_timestamp":1.7736529122560904e+09,"data_time":0.0011823320000985404,"epoch":0.27,"_step":2000,"learning_rate":4.000000000000001e-06,"model_time":0.6259748869997566,"mse_score":0.024974743029601894}

checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085932-77uivys0/logs/debug-core.log ADDED Viewed

	@@ -0,0 +1,19 @@

+{"time":"2026-03-16T08:59:32.403945867Z","level":"INFO","msg":"main: starting server","port-filename":"/tmp/tmp4t0a4ncq/port-99195.txt","pid":99195,"log-level":0,"disable-analytics":false,"shutdown-on-parent-exit":false,"enable-dcgm-profiling":false}
+{"time":"2026-03-16T08:59:32.404969234Z","level":"INFO","msg":"server: will exit if parent process dies","ppid":99195}
+{"time":"2026-03-16T08:59:32.40490197Z","level":"INFO","msg":"server: accepting connections","addr":{"Name":"/tmp/wandb-99195-99415-2576437537/socket","Net":"unix"}}
+{"time":"2026-03-16T08:59:32.591555919Z","level":"INFO","msg":"connection: ManageConnectionData: new connection created","id":"1(@)"}
+{"time":"2026-03-16T08:59:32.597607048Z","level":"INFO","msg":"handleInformInit: received","streamId":"77uivys0","id":"1(@)"}
+{"time":"2026-03-16T08:59:32.929876125Z","level":"INFO","msg":"handleInformInit: stream started","streamId":"77uivys0","id":"1(@)"}
+{"time":"2026-03-16T08:59:38.545990692Z","level":"INFO","msg":"connection: cancelling request","id":"1(@)","requestId":"eudg0a53iy1r"}
+{"time":"2026-03-16T09:22:34.984931403Z","level":"INFO","msg":"connection: cancelling request","id":"1(@)","requestId":"eudg0a53iy1r"}
+{"time":"2026-03-16T09:22:37.084517062Z","level":"INFO","msg":"connection: cancelling request","id":"1(@)","requestId":"eudg0a53iy1r"}
+{"time":"2026-03-16T09:22:37.085018345Z","level":"INFO","msg":"handleInformFinish: finish message received","streamId":"77uivys0","id":"1(@)"}
+{"time":"2026-03-16T09:22:42.885065864Z","level":"INFO","msg":"handleInformFinish: stream closed","streamId":"77uivys0","id":"1(@)"}
+{"time":"2026-03-16T09:22:42.885112268Z","level":"INFO","msg":"handleInformTeardown: server teardown initiated","id":"1(@)"}
+{"time":"2026-03-16T09:22:42.885128801Z","level":"INFO","msg":"handleInformTeardown: server shutdown complete","id":"1(@)"}
+{"time":"2026-03-16T09:22:42.885143933Z","level":"INFO","msg":"connection: closing","id":"1(@)"}
+{"time":"2026-03-16T09:22:42.885176198Z","level":"INFO","msg":"server is shutting down"}
+{"time":"2026-03-16T09:22:42.885192466Z","level":"INFO","msg":"connection: closed successfully","id":"1(@)"}
+{"time":"2026-03-16T09:22:42.885291192Z","level":"INFO","msg":"connection: ManageConnectionData: connection closed","id":"1(@)"}
+{"time":"2026-03-16T09:22:42.88528875Z","level":"INFO","msg":"server: listener closed","addr":{"Name":"/tmp/wandb-99195-99415-2576437537/socket","Net":"unix"}}
+{"time":"2026-03-16T09:22:42.8853253Z","level":"INFO","msg":"server is closed"}

checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085932-77uivys0/logs/debug-internal.log ADDED Viewed

	@@ -0,0 +1,12 @@

+{"time":"2026-03-16T08:59:32.597734449Z","level":"INFO","msg":"stream: starting","core version":"0.24.2"}
+{"time":"2026-03-16T08:59:32.929605272Z","level":"INFO","msg":"stream: created new stream","id":"77uivys0"}
+{"time":"2026-03-16T08:59:32.929695195Z","level":"INFO","msg":"handler: started","stream_id":"77uivys0"}
+{"time":"2026-03-16T08:59:32.929863345Z","level":"INFO","msg":"stream: started","id":"77uivys0"}
+{"time":"2026-03-16T08:59:32.929879846Z","level":"INFO","msg":"writer: started","stream_id":"77uivys0"}
+{"time":"2026-03-16T08:59:32.929905429Z","level":"INFO","msg":"sender: started","stream_id":"77uivys0"}
+{"time":"2026-03-16T09:22:36.766341662Z","level":"INFO","msg":"fileTransfer: Close: file transfer manager closed"}
+{"time":"2026-03-16T09:22:37.079259981Z","level":"INFO","msg":"handler: operation stats","stats":{}}
+{"time":"2026-03-16T09:22:37.085052418Z","level":"INFO","msg":"stream: closing","id":"77uivys0"}
+{"time":"2026-03-16T09:22:37.085074372Z","level":"INFO","msg":"handler: closed","stream_id":"77uivys0"}
+{"time":"2026-03-16T09:22:37.085174386Z","level":"INFO","msg":"sender: closed","stream_id":"77uivys0"}
+{"time":"2026-03-16T09:22:37.08518525Z","level":"INFO","msg":"stream: closed","id":"77uivys0"}

checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085932-77uivys0/logs/debug.log ADDED Viewed

File without changes

checkpoints/finetune_task2_2000step/wandb/wandb/run-20260316_085932-77uivys0/run-77uivys0.wandb ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:52e378b08e9483ef51f45054dd527a45040eab66446aba7b2f7dcfae217740d6
+size 713828