|
|
--- |
|
|
language: zh |
|
|
license: apache-2.0 |
|
|
tags: |
|
|
- reinforcement-learning |
|
|
- imitation-learning |
|
|
- act-policy |
|
|
- gym-hil |
|
|
- robotics |
|
|
- pytorch |
|
|
library_name: pytorch |
|
|
model_name: ACT Policy |
|
|
datasets: |
|
|
- C6thunder/stu-work |
|
|
tasks: |
|
|
- imitation-learning |
|
|
- policy-learning |
|
|
metrics: |
|
|
- loss |
|
|
- accuracy |
|
|
--- |
|
|
# ACT Policy 模型与数据集说明文档 |
|
|
|
|
|
## 1. 项目背景 |
|
|
|
|
|
本项目基于 **LeRobot 提供的 `gym_hil` 环境**,通过 **模仿学习(Imitation Learning)** 训练 **ACT(Action Chunk Transformer)策略**,实现机器人操作任务的行为克隆。 |
|
|
|
|
|
主要任务包括: |
|
|
|
|
|
1. 使用人类专家操作采集训练数据; |
|
|
2. 训练 ACT Policy 模型; |
|
|
3. 使用训练好的策略执行任务并采集模型行为数据; |
|
|
4. 将人类专家数据和模型采集数据上传至 Hugging Face Datasets; |
|
|
5. 将训练好的模型权重上传至 Hugging Face Hub,并提供加载示例。 |
|
|
|
|
|
--- |
|
|
|
|
|
## 2. 数据集说明 |
|
|
|
|
|
### 2.1 人类专家数据 |
|
|
|
|
|
- **数据来源**:LeRobot `gym_hil` 环境中人类专家操作记录(个人采集-30次) |