LuckLin commited on
Commit
7fdee4a
·
verified ·
1 Parent(s): 97957d8

Upload README.md with huggingface_hub

Browse files
Files changed (1) hide show
  1. README.md +49 -0
README.md ADDED
@@ -0,0 +1,49 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ tags:
3
+ - unity-ml-agents
4
+ - deep-reinforcement-learning
5
+ - reinforcement-learning
6
+ - ML-Agents-Huggy
7
+ library_name: ml-agents
8
+ ---
9
+
10
+ # PPO Agent for Huggy 🐶
11
+
12
+ 这是一个使用 **Unity ML-Agents** 训练的强化学习模型。该模型训练了一个叫 **Huggy** 的蓝色小狗机器人,它的目标是学会在环境中准确地移动并“抱住”目标(通常是玩家的手)。
13
+
14
+ ## 训练成果展示
15
+ * **算法**: PPO (Proximal Policy Optimization)
16
+ * **训练步数**: 2,000,000 steps
17
+ * **平均奖励 (Mean Reward)**: ~3.8 - 4.0 (已收敛)
18
+
19
+ ## 模型描述
20
+ 该 Agent 使用了深度神经网络(3层,每层 512 个隐藏单元)来处理环境观测。
21
+ - **观测空间 (Observation Space)**: 包含 Huggy 的关节位置、速度以及目标物体的相对位置。
22
+ - **动作空间 (Action Space)**: 连续动作,控制 Huggy 各个腿部关节的力矩。
23
+
24
+
25
+
26
+ ## 使用方法
27
+ 要在 Unity 中使用此模型:
28
+ 1. 安装 [Unity ML-Agents Toolkit](https://github.com/Unity-Technologies/ml-agents)。
29
+ 2. 下载本仓库中的 `Huggy.onnx` 文件。
30
+ 3. 将 `.onnx` 文件拖入 Unity 项目。
31
+ 4. 在 Huggy 对象的 `Behavior Parameters` 组件中,将该文件拖入 `Model` 字段。
32
+ 5. 按下 Play 键观察效果。
33
+
34
+ ## 训练配置 (Hyperparameters)
35
+ ```yaml
36
+ trainer_type: ppo
37
+ hyperparameters:
38
+ batch_size: 2048
39
+ buffer_size: 20480
40
+ learning_rate: 0.0003
41
+ beta: 0.005
42
+ epsilon: 0.2
43
+ lambd: 0.95
44
+ num_epoch: 3
45
+ learning_rate_schedule: linear
46
+ network_settings:
47
+ normalize: true
48
+ hidden_units: 512
49
+ num_layers: 3