Larer
/

spatial-mllm-v11-kit

Larer commited on May 26

Commit

242eca2

verified ·

1 Parent(s): 74ce6c4

Upload COAUTHOR_TRAIN_KIT.md with huggingface_hub

Files changed (1) hide show

COAUTHOR_TRAIN_KIT.md CHANGED Viewed

@@ -14,6 +14,7 @@ archives/batch_v5.tar                   9.3 GB  v8_clean 渲染图
 archives/osd_images.tar                 5.2 GB  OSD 引用子集 (16,657 张)
 archives/msmu_parts/msmu_part_00..06   27 GB   MSMU 图像 (split 成 7 块, 单文件传不动)
 archives/llamafactory_src.tar.gz        4.5 MB  改过的 LLaMA-Factory 源码 (含 dpo_p2_weight trainer)
 jsonl/                                  五个 jsonl + dataset_info.json
 config/mgeo_full_dpo_v11_mix_h20.yaml   训练 yaml
 scripts/                                build_mix / extract_osd / run_chain
@@ -113,7 +114,20 @@ CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6,7 \
 **预计**: ~70k / 32 batch × 1 epoch ≈ 2200 step；8× H20 约 4-6 h。
-## 6. 训练完后回传
 ```bash
 # Checkpoint
@@ -125,7 +139,7 @@ huggingface-cli upload Larer/spatial-mllm-v11-mix-h20-ckpt \
     . --repo-type model
 ```
-## 7. 注意事项
 - 路径要么用 symlink 复刻 `/data222/hongbo.wang/Spatial_MLLM/`，要么 sed 改 jsonl，**二选一别都改**
 - 第一次 `llamafactory-cli train` 会缓存预处理 token (~3 GB 在 `data/cache/`)，可清

 archives/osd_images.tar                 5.2 GB  OSD 引用子集 (16,657 张)
 archives/msmu_parts/msmu_part_00..06   27 GB   MSMU 图像 (split 成 7 块, 单文件传不动)
 archives/llamafactory_src.tar.gz        4.5 MB  改过的 LLaMA-Factory 源码 (含 dpo_p2_weight trainer)
+archives/evals_kit.tar.gz               1.0 GB  三 bench 评测套件 (P3 + SpatialRGPT + ViewSpatial)
 jsonl/                                  五个 jsonl + dataset_info.json
 config/mgeo_full_dpo_v11_mix_h20.yaml   训练 yaml
 scripts/                                build_mix / extract_osd / run_chain
 **预计**: ~70k / 32 batch × 1 epoch ≈ 2200 step；8× H20 约 4-6 h。
+## 6. 三 bench 评测 (可选 — 默认让一作做)
+若想自己 sanity check 跑 P3 / SpatialRGPT / ViewSpatial 三 bench：
+```bash
+tar -xzf $KIT/archives/evals_kit.tar.gz -C $KIT
+mkdir -p $KIT/evals
+mv $KIT/{p3,spatialrgpt,viewspatial,EVAL_KIT.md} $KIT/evals/
+cat $KIT/evals/EVAL_KIT.md   # 完整说明
+```
+详见 [`evals/EVAL_KIT.md`](archives/evals_kit.tar.gz)：bench 数据 + 评测脚本 + 历史 baseline preds 全在里面。
+## 7. 训练完后回传
 ```bash
 # Checkpoint
     . --repo-type model
 ```
+## 8. 注意事项
 - 路径要么用 symlink 复刻 `/data222/hongbo.wang/Spatial_MLLM/`，要么 sed 改 jsonl，**二选一别都改**
 - 第一次 `llamafactory-cli train` 会缓存预处理 token (~3 GB 在 `data/cache/`)，可清