本仓库是对Qwen3系列的3个开源模型的二次封装和量化,仅适用于Nano电子鹦鹉。包括以下3个模型:
有FP32(原始精度强制转换到FP32)和Q80(W8A32)两个量化规格。
推理引擎的主线实现只支持Q80量化规格。
具体用例请转到GitHub,查看视频或在线体验。
-
Base model