AXERA-TECH
/

ppq-xs

Model card Files Files and versions

ppq-xs / models /readme.md

jounery-d's picture

Update models/readme.md

824ed0b verified 3 months ago

|

history blame contribute delete

3.01 kB

	# 模型修改说明：
	为了适配5x系列NPU，Yolo系列模型结构需要做一些修改，这里以ultralytics项目的YoloV8检测模型为例进行说明：

	项目官方位置：
	```
	https://github.com/ultralytics/ultralytics
	```

	### 1、修改激活函数：
	5x系列NPU不支持silu算子，因此激活函数需要修改act为leaky relu或relu算子，修改的文件如下：
	```
	https://github.com/ultralytics/ultralytics/blob/main/ultralytics/nn/modules/conv.py
	```
	将第50行修改为:
	```
	default_act = nn.LeakyReLU() # default activation
	```
	或者：
	```
	default_act = nn.ReLU() # default activation
	```

	### 2、模型最大channel数限制：
	5x系列NPU支持最大的channel数为：1024，如果模型结构的某一层的channel>1024，需要将该层的channel减少至<=1024

	channel数可以在模型描述文件.yaml中进行修改，yolov8.yaml文件位置：
	```
	https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/models/v8/yolov8.yaml
	```

	yaml配置如下：
	```
	# Parameters
	nc: 80 # number of classes
	scales: # model compound scaling constants, i.e. 'model=yolov8n.yaml' will call yolov8.yaml with scale 'n'
	# [depth, width, max_channels]
	n: [0.33, 0.25, 1024] # YOLOv8n summary: 129 layers, 3157200 parameters, 3157184 gradients, 8.9 GFLOPS
	s: [0.33, 0.50, 1024] # YOLOv8s summary: 129 layers, 11166560 parameters, 11166544 gradients, 28.8 GFLOPS
	m: [0.67, 0.75, 768] # YOLOv8m summary: 169 layers, 25902640 parameters, 25902624 gradients, 79.3 GFLOPS
	l: [1.00, 1.00, 512] # YOLOv8l summary: 209 layers, 43691520 parameters, 43691504 gradients, 165.7 GFLOPS
	x: [1.00, 1.25, 512] # YOLOv8x summary: 209 layers, 68229648 parameters, 68229632 gradients, 258.5 GFLOPS
	```
	将channel>1024的修改为<=1024，即可；


	### 3、模型重训练及onnx导出
	基于上述2处修改完成后，对模型进行重训练，生成训练模型：yolov8n.pt，然后进行onnx导出;

	ultralytics导出yolov8模型onnx的代码如下：
	```
	from ultralytics import YOLO
	model = YOLO("yolov8n.pt")
	path = model.export(format="onnx", imgsz=640, opset=11) # 返回导出模型的路径
	```
	*注意：opset需设置为11，imgsz根据需要进行设置

	但是直接导出的onnx会将模型head部分的decode_bboxes算子包含进去，decode_bboxes算子5x系列npu无法支持,会导致工具转换无法通过

	decode_bboxes算子需要通过cpu进行实现，因此导出onnx不能带上decode_bboxes部分，需要进行修改：

	修改文件：
	```
	https://github.com/ultralytics/ultralytics/blob/main/ultralytics/nn/modules/head.py
	```
	将125行代码：
	```
	y = self._inference(x)
	```
	修改为：
	```
	if self.export:
	y = x
	else:
	y = self._inference(x)
	```
	修改上述文件后，重新export即可，导出的onnx参考：models/yolov8n.onnx

	或者使用第三方工具手动裁剪onnx

	### 4、模型转换生成axmodel及上板测试
	参考：
	[链接](https://huggingface.co/AXERA-TECH/ppq-xs/blob/main/config/readme.md)