grapevine-AI
/

Qwen3-Coder-30B-A3B-Instruct-GGUF

Model card Files Files and versions

grapevine-AI commited on Aug 2, 2025

Commit

9337523

·

verified ·

1 Parent(s): 39f8f77

Update README.md

Files changed (1) hide show

README.md +4 -11

README.md CHANGED Viewed

@@ -2,7 +2,7 @@
 license: apache-2.0
 ---
 # What is this?
-Qwen3-Coder-Flashこと[Qwen3-Coder-30B-A3B-Instruct](https://huggingface.co/Qwen/Qwen3-Coder-30B-A3B-Instruct)を日本語imatrixで量子化したものです。
 # imatrix dataset
 日本語能力を重視し、日本語が多量に含まれる[TFMC/imatrix-dataset-for-japanese-llm](https://huggingface.co/datasets/TFMC/imatrix-dataset-for-japanese-llm)データセットを使用しました。
@@ -15,16 +15,9 @@ Qwen3-Coder-Flashこと[Qwen3-Coder-30B-A3B-Instruct](https://huggingface.co/Qwe
 ここにMessageを書きます。<|im_end|>
 <|im_start|>assistant
 ```
-<!--
-# Quants
-各クオンツとそのベンチマークスコア（Gemini 2.0 Flash採点によるElyza_tasks 100）をまとめておきます。
-|クオンツ|スコア|コメント|
-|---|---|---|
-|Q8_0|||
-|Q6_K|||
-|Q5_K_M|||
-|Q4_K_M|4.19|改良前より0.12点アップ！|
-|IQ4_XS||| -->
 # Environment
 Windows版llama.cpp-b5902を使用して量子化作業を実施しました。

 license: apache-2.0
 ---
 # What is this?
+Qwen3-Coder-Flashこと[Qwen3-Coder-30B-A3B-Instruct](https://huggingface.co/Qwen/Qwen3-Coder-30B-A3B-Instruct)をGGUFフォーマットに変換したものです。
 # imatrix dataset
 日本語能力を重視し、日本語が多量に含まれる[TFMC/imatrix-dataset-for-japanese-llm](https://huggingface.co/datasets/TFMC/imatrix-dataset-for-japanese-llm)データセットを使用しました。
 ここにMessageを書きます。<|im_end|>
 <|im_start|>assistant
 ```
+# Note
+Q4_K_MおよびQ5_K_Mクオンツのみ、Q8_0クオンツを再量子化するという方法で作成しました。これは、通常通りBF16から量子化しようとすると原因不明のエラーが発生してしまうためです。
 # Environment
 Windows版llama.cpp-b5902を使用して量子化作業を実施しました。