# Diffusion Policy Checkpoint - Step 100000 这是第100000步的diffusion policy训练checkpoint,用于机器人视觉运动控制。 ## 模型信息 - **模型类型**: Diffusion Policy - **训练步数**: 100,000 - **视觉骨干网络**: resnet18 - **输入观察步数**: 2 - **动作步数**: 8 - **时间范围**: 16 - **扩散步数**: 100 ## 输入特征 - **状态观察**: [8] 维 - **头部相机图像**: [3, 256, 256] (RGB, 256x256) ## 输出特征 - **动作**: [7] 维 ## 训练配置 - **批次大小**: 16 - **学习率**: 0.0001 - **优化器**: adam - **数据集**: /home/shuo/research/datasets/steer_test_lerobot ## 文件结构 ``` 100000/ ├── pretrained_model/ │ ├── model.safetensors # 模型权重 (~1005MB) │ ├── config.json # 模型配置 │ └── train_config.json # 训练配置 └── training_state/ ├── optimizer_state.safetensors # 优化器状态 (~2GB) ├── scheduler_state.json # 学习率调度器状态 ├── optimizer_param_groups.json # 优化器参数组 ├── rng_state.safetensors # 随机数生成器状态 └── training_step.json # 训练步数信息 ``` ## 使用方法 ### 加载模型 ```python import torch from lerobot.common.policies.diffusion import DiffusionPolicy # 加载配置 config_path = "pretrained_model/config.json" with open(config_path, 'r') as f: config = json.load(f) # 创建模型 policy = DiffusionPolicy(config) # 加载权重 checkpoint = torch.load("pretrained_model/model.safetensors", map_location='cpu') policy.load_state_dict(checkpoint) ``` ### 恢复训练 ```python # 加载训练状态 training_state = torch.load("training_state/optimizer_state.safetensors") optimizer.load_state_dict(training_state) # 继续训练 # ... 训练代码 ``` ## 数据集 此模型在rainbow_real数据集上训练,包含机器人操作任务。 ## 许可证 请参考原始项目的许可证。