Sortpackage / README.md
SONGAYNFEI's picture
Update model card with step56000 recommendation
58202d4 verified
|
Raw
History Blame Contribute Delete
3.63 kB
---
tags:
- robotics
- embodied-ai
- policy
- geniesim
- g2-90d
- package-sorting
language:
- zh
- en
library_name: openpi
---
# Sortpackage G2_90d Policy Checkpoints
本仓库保存用于具身智能分拣包裹实验的 inference-only policy checkpoint。当前推荐候选是 `step56000/`。
## 目标机器人
- 机器人配置:`G2_90d`
- 夹爪:90D 新夹爪
- 运行环境:GenieSim / G2 90D gripper 仿真环境
- 推荐策略提示词:`Sort Packages`
## 目标任务
策略用于 `sorting_packages_continuous` / `Sort Packages` 任务:机器人在桌面或仓储工作台场景中抓取包裹/盒子,并尝试完成向右转腰和放置/分拣流程。
## Checkpoints
```text
round2_step85000/
step56000/
```
每个 checkpoint 均只包含推理所需文件,不包含 optimizer state 或训练分片缓存。
`step56000/` 文件结构:
```text
step56000/model.safetensors
step56000/metadata.pt
step56000/assets/pi05_popcorn_21d/norm_stats.json
step56000/assets/pi05_sort_packages_combined_21d/norm_stats.json
```
其中 `pi05_sort_packages_combined_21d` 是原始 asset 名,`pi05_popcorn_21d` 是为了兼容当前 runtime 默认查找路径而保留的一份同内容 `norm_stats.json`
## 当前模型选择结论
按同一规格评测:自然光 6500K / 1000,prompt 为 `Sort Packages`,新夹爪环境,无 mapper,seeds 为 `1 11 21 31 41 51 61 71`,每个权重 32 局。
| 权重 | 抓取 | E2E | upright | inside | 抓后右转腰部 |
|---|---:|---:|---:|---:|---:|
| `round2_step85000` | 4/32 | 0/32 | 1 | 0 | 0 |
| `step56000` | 3/32 | 0/32 | 2 | 1 | 1 |
| `step64000` | 2/32 | 0/32 | 1 | 0 | 0 |
明确选择:`step56000` 是当前最佳候选。它的抓取率低于旧 `round2_step85000`,但它是唯一出现 `inside=1` 和抓取后明显右转腰部的权重,更接近完整分拣流程。`round2_step85000` 适合作为抓取率较高的基线;`step64000` 弱于 `step56000`
当前评测仍未出现 E2E 成功,因此这些权重更适合作为研究和继续调试的 checkpoint,而不是稳定生产策略。
## Action 维度对应
策略输出为 21 维动作。在当前 G2_90d 新夹爪环境中使用直接布局,不需要旧 motion mapper,也不需要对夹爪做 relabel。
| 维度 | 关节/含义 |
|---:|---|
| 0 | `idx21_arm_l_joint1` |
| 1 | `idx22_arm_l_joint2` |
| 2 | `idx23_arm_l_joint3` |
| 3 | `idx24_arm_l_joint4` |
| 4 | `idx25_arm_l_joint5` |
| 5 | `idx26_arm_l_joint6` |
| 6 | `idx27_arm_l_joint7` |
| 7 | `idx61_arm_r_joint1` |
| 8 | `idx62_arm_r_joint2` |
| 9 | `idx63_arm_r_joint3` |
| 10 | `idx64_arm_r_joint4` |
| 11 | `idx65_arm_r_joint5` |
| 12 | `idx66_arm_r_joint6` |
| 13 | `idx67_arm_r_joint7` |
| 14 | `idx32_gripper_l_outer_joint1` |
| 15 | `idx72_gripper_r_outer_joint1` |
| 16 | `idx01_body_joint1` |
| 17 | `idx02_body_joint2` |
| 18 | `idx03_body_joint3` |
| 19 | `idx04_body_joint4` |
| 20 | `idx05_body_joint5` |
维度分组:
- `0:14`:G2 左右双臂 14 个关节,左臂 7 维后接右臂 7 维。
- `14:16`:90D 左右夹爪 2 维。
- `16:21`:G2 腰部/躯干 5 维,运行时对应 `idx01_body_joint1``idx05_body_joint5`
## 推理说明
容器内可将目标 checkpoint 挂载到 runtime 默认目录:
```text
/home/syf/popcorn_pi05_best_9000
```
策略服务 prompt 建议固定为:
```text
Sort Packages
```
## 注意事项
- 面向 `G2_90d` 新夹爪布局;不要按旧 `idx41/idx81` 夹爪接口使用。
- 当前布局下不需要旧 motion mapper。
- `step56000` 是当前最佳整体候选,但 E2E 仍为 0/32,需要继续前台复现和定位。