File size: 3,010 Bytes
9409863
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
ee380a5
17fe394
ee380a5
9409863
 
 
 
17fe394
 
 
 
 
 
 
 
 
 
 
 
 
 
 
9409863
 
 
 
 
 
 
 
 
 
 
970e586
a5e634c
970e586
6397281
9409863
 
 
 
 
 
 
 
 
 
 
 
 
 
 
17fe394
9409863
 
 
824ed0b
9409863
09b571e
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
# 模型修改说明:
为了适配5x系列NPU,Yolo系列模型结构需要做一些修改,这里以ultralytics项目的YoloV8检测模型为例进行说明:

项目官方位置:
```
https://github.com/ultralytics/ultralytics
```

### 1、修改激活函数:
5x系列NPU不支持silu算子,因此激活函数需要修改act为leaky relu或relu算子,修改的文件如下:
```
https://github.com/ultralytics/ultralytics/blob/main/ultralytics/nn/modules/conv.py
```
将第50行修改为:
```
   default_act = nn.LeakyReLU()   # default activation
```
或者:
```
   default_act = nn.ReLU()    # default activation
```

### 2、模型最大channel数限制:
5x系列NPU支持最大的channel数为:1024,如果模型结构的某一层的channel>1024,需要将该层的channel减少至<=1024

channel数可以在模型描述文件.yaml中进行修改,yolov8.yaml文件位置:
```
https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/models/v8/yolov8.yaml
```

yaml配置如下:
```
# Parameters
nc: 80 # number of classes
scales: # model compound scaling constants, i.e. 'model=yolov8n.yaml' will call yolov8.yaml with scale 'n'
  # [depth, width, max_channels]
  n: [0.33, 0.25, 1024] # YOLOv8n summary: 129 layers, 3157200 parameters, 3157184 gradients, 8.9 GFLOPS
  s: [0.33, 0.50, 1024] # YOLOv8s summary: 129 layers, 11166560 parameters, 11166544 gradients, 28.8 GFLOPS
  m: [0.67, 0.75, 768] # YOLOv8m summary: 169 layers, 25902640 parameters, 25902624 gradients, 79.3 GFLOPS
  l: [1.00, 1.00, 512] # YOLOv8l summary: 209 layers, 43691520 parameters, 43691504 gradients, 165.7 GFLOPS
  x: [1.00, 1.25, 512] # YOLOv8x summary: 209 layers, 68229648 parameters, 68229632 gradients, 258.5 GFLOPS
```
将channel>1024的修改为<=1024,即可;


### 3、模型重训练及onnx导出
基于上述2处修改完成后,对模型进行重训练,生成训练模型:yolov8n.pt,然后进行onnx导出;

ultralytics导出yolov8模型onnx的代码如下:
```
from ultralytics import YOLO
model = YOLO("yolov8n.pt")
path = model.export(format="onnx", imgsz=640, opset=11)  # 返回导出模型的路径
```
*注意:opset需设置为11,imgsz根据需要进行设置

但是直接导出的onnx会将模型head部分的decode_bboxes算子包含进去,decode_bboxes算子5x系列npu无法支持,会导致工具转换无法通过

decode_bboxes算子需要通过cpu进行实现,因此导出onnx不能带上decode_bboxes部分,需要进行修改:

修改文件:
```
https://github.com/ultralytics/ultralytics/blob/main/ultralytics/nn/modules/head.py
```
将125行代码:
```
y = self._inference(x)
```
修改为:
```
if self.export:
    y = x
else:
    y = self._inference(x)
```
修改上述文件后,重新export即可,导出的onnx参考:models/yolov8n.onnx

或者使用第三方工具手动裁剪onnx

### 4、模型转换生成axmodel及上板测试
参考:
[链接](https://huggingface.co/AXERA-TECH/ppq-xs/blob/main/config/readme.md)