mlx-community
/

RakutenAI-3.0-MLX-4bit

Text Generation

4-bit precision

Model card Files Files and versions

limegreenpeper1 commited on Mar 18

Commit

4bf9e94

·

verified ·

1 Parent(s): 61221af

Update README.md

Files changed (1) hide show

README.md +3 -2

README.md CHANGED Viewed

@@ -15,8 +15,8 @@ base_model:
 This model was converted to MLX format from [`Rakuten/RakutenAI-3.0`](https://huggingface.co/Rakuten/RakutenAI-3.0) using mlx-lm version **0.31.0**.
 Refer to the [original model card](https://huggingface.co/Rakuten/RakutenAI-3.0) for more details on the model.
-Convert:
-❯ mlx_lm.convert --hf-path ./RakutenAI-3.0 --mlx-path ./lm-studio/models/limegreenpeper1/rakutenai3-mlx-4bit  -q --q-bits 4 --trust-remote-code
 [INFO] Loading
 `rope_parameters`'s factor field must be a float >= 1, got 40
 `rope_parameters`'s beta_fast field must be a float, got 32
@@ -25,4 +25,5 @@ Convert:
 [INFO] Quantizing
 [INFO] Quantized model with 4.502 bits per weight.
 Inference: 20.06 tok/sec M3 Ultra (CTX 128K - LM Studio MLX v1.3.0)

 This model was converted to MLX format from [`Rakuten/RakutenAI-3.0`](https://huggingface.co/Rakuten/RakutenAI-3.0) using mlx-lm version **0.31.0**.
 Refer to the [original model card](https://huggingface.co/Rakuten/RakutenAI-3.0) for more details on the model.
+Convert:❯ mlx_lm.convert --hf-path ./RakutenAI-3.0 --mlx-path ./lm-studio/models/limegreenpeper1/rakutenai3-mlx-4bit  -q --q-bits 4 --trust-remote-code
 [INFO] Loading
 `rope_parameters`'s factor field must be a float >= 1, got 40
 `rope_parameters`'s beta_fast field must be a float, got 32
 [INFO] Quantizing
 [INFO] Quantized model with 4.502 bits per weight.
 Inference: 20.06 tok/sec M3 Ultra (CTX 128K - LM Studio MLX v1.3.0)