用于Nano电子鹦鹉端上部署的Qwen3语言模型

本仓库是对Qwen3系列的3个开源模型的二次封装和量化,仅适用于Nano电子鹦鹉。包括以下3个模型:

  • Qwen3-0.6B
  • Qwen3-1.7B
  • Qwen3-4B-Instruct-2507

有FP32(原始精度强制转换到FP32)和Q80(W8A32)两个量化规格。

推理引擎的主线实现只支持Q80量化规格。

具体用例请转到GitHub,查看视频或在线体验。

Downloads last month

-

Downloads are not tracked for this model. How to track
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for bd4sur/Qwen3

Finetuned
Qwen/Qwen3-0.6B
Finetuned
(524)
this model