dwko
/

Alpamayo-R1-10B-4bit

@@ -6,35 +6,29 @@ base_model:
 nvidia/Alpamayo-R1-10B 4bit Model.
- model download  ./Alpamayo-R1-10B-4bit
- GPU 12G Memory Run abble, num_frames is 1 ~ 8, over OOM
- Transformers is 4.57.5 ( 5.0.0rc not run)
--------------------------
 import torch
 import numpy as np
 from alpamayo_r1.models.alpamayo_r1 import AlpamayoR1
 from alpamayo_r1.load_physical_aiavdataset import load_physical_aiavdataset
 from alpamayo_r1 import helper
 model_path = "Alpamayo-R1-10B-4bit"
 model = AlpamayoR1.from_pretrained(model_path, dtype=torch.bfloat16).to("cuda")
 processor = helper.get_processor(model.tokenizer)
 clip_id = "030c760c-ae38-49aa-9ad8-f5650a545d26"
 print(f"Loading dataset for clip_id: {clip_id}...")
 data = load_physical_aiavdataset(clip_id, t0_us=15_100_000,num_frames=1)
 print("Dataset loaded.")
 messages = helper.create_message(data["image_frames"].flatten(0, 1))
@@ -55,11 +49,8 @@ model_inputs = {
 }
 model_inputs = helper.to_device(model_inputs, "cuda")
 torch.cuda.manual_seed_all(42)
 with torch.autocast("cuda", dtype=torch.bfloat16):
     pred_xyz, pred_rot, extra = model.sample_trajectories_from_data_with_vlm_rollout(
         data=model_inputs,
         top_p=0.98,
@@ -71,23 +62,17 @@ with torch.autocast("cuda", dtype=torch.bfloat16):
 print("Chain-of-Causation (per trajectory):\n", extra["cot"][0])
 gt_xy = data["ego_future_xyz"].cpu()[0, 0, :, :2].T.numpy()
 pred_xy = pred_xyz.cpu().numpy()[0, 0, :, :, :2].transpose(0, 2, 1)
 diff = np.linalg.norm(pred_xy - gt_xy[None, ...], axis=1).mean(-1)
 min_ade = diff.min()
 print("minADE:", min_ade, "meters")
 print(
     "Note: VLA-reasoning models produce nondeterministic outputs due to trajectory sampling, "
     "hardware differences, etc. With num_traj_samples=1 (set for GPU memory compatibility), "
     "variance in minADE is expected. For visual sanity checks, see notebooks/inference.ipynb"
 )
 --------------------
 Result:

 nvidia/Alpamayo-R1-10B 4bit Model.
+model download  ./Alpamayo-R1-10B-4bit
+GPU 12G Memory Run abble, num_frames is 1 ~ 8, over OOM
+Transformers is 4.57.5 ( 5.0.0rc not run)
+-----------------------------------
+```python
 import torch
 import numpy as np
 from alpamayo_r1.models.alpamayo_r1 import AlpamayoR1
 from alpamayo_r1.load_physical_aiavdataset import load_physical_aiavdataset
 from alpamayo_r1 import helper
 model_path = "Alpamayo-R1-10B-4bit"
 model = AlpamayoR1.from_pretrained(model_path, dtype=torch.bfloat16).to("cuda")
 processor = helper.get_processor(model.tokenizer)
 clip_id = "030c760c-ae38-49aa-9ad8-f5650a545d26"
 print(f"Loading dataset for clip_id: {clip_id}...")
+#need set access token or huggingface-cli login...
 data = load_physical_aiavdataset(clip_id, t0_us=15_100_000,num_frames=1)
 print("Dataset loaded.")
 messages = helper.create_message(data["image_frames"].flatten(0, 1))
 }
 model_inputs = helper.to_device(model_inputs, "cuda")
 torch.cuda.manual_seed_all(42)
 with torch.autocast("cuda", dtype=torch.bfloat16):
     pred_xyz, pred_rot, extra = model.sample_trajectories_from_data_with_vlm_rollout(
         data=model_inputs,
         top_p=0.98,
 print("Chain-of-Causation (per trajectory):\n", extra["cot"][0])
 gt_xy = data["ego_future_xyz"].cpu()[0, 0, :, :2].T.numpy()
 pred_xy = pred_xyz.cpu().numpy()[0, 0, :, :, :2].transpose(0, 2, 1)
 diff = np.linalg.norm(pred_xy - gt_xy[None, ...], axis=1).mean(-1)
 min_ade = diff.min()
 print("minADE:", min_ade, "meters")
 print(
     "Note: VLA-reasoning models produce nondeterministic outputs due to trajectory sampling, "
     "hardware differences, etc. With num_traj_samples=1 (set for GPU memory compatibility), "
     "variance in minADE is expected. For visual sanity checks, see notebooks/inference.ipynb"
 )
+```
 --------------------
 Result: