OsaurusAI
/

gemma-4-E4B-it-4bit

4-bit precision

Model card Files Files and versions

Osaurus-AI commited on 16 days ago

Commit

c75f732

·

verified ·

1 Parent(s): f4ccebe

Update usage to Osaurus branding

Files changed (1) hide show

README.md +5 -7

README.md CHANGED Viewed

@@ -65,9 +65,13 @@ mlx-vlm's default quantization predicate automatically keeps MLP gate/up/down pr
 ## Usage
-### With mlx-vlm
 ```python
 from mlx_vlm import load, generate
 model, processor = load("OsaurusAI/gemma-4-E4B-it-4bit")
@@ -79,12 +83,6 @@ output = generate(model, processor, "Explain quantum computing", max_tokens=500)
 output = generate(model, processor, "Describe this image", ["path/to/image.jpg"], max_tokens=500)
 ```
-### With vMLX / vllm-mlx
-```bash
-vllm-mlx serve OsaurusAI/gemma-4-E4B-it-4bit
-```
 ## Conversion Details
 | Detail | Value |

 ## Usage
+```bash
+# Requires Osaurus (https://osaurus.ai)
+osaurus serve OsaurusAI/gemma-4-E4B-it-4bit
+```
 ```python
+# Python API
 from mlx_vlm import load, generate
 model, processor = load("OsaurusAI/gemma-4-E4B-it-4bit")
 output = generate(model, processor, "Describe this image", ["path/to/image.jpg"], max_tokens=500)
 ```
 ## Conversion Details
 | Detail | Value |