tiny-random
/

qwen3.5-moe

Image-Text-to-Text

Model card Files Files and versions

yujiepan commited on 19 days ago

Commit

940a1ec

·

verified ·

1 Parent(s): e16779f

Upload folder using huggingface_hub

Files changed (2) hide show

README.md +4 -2
model.safetensors +1 -1

README.md CHANGED Viewed

@@ -33,7 +33,9 @@ vllm serve $model_id \
 ```bash
 # Multi-token prediction is supported
 model_id=tiny-random/qwen3.5-moe
-python3 -m sglang.launch_server   --model-path $model_id   --tp-size 2 \
   --tool-call-parser qwen3_coder  \
   --reasoning-parser qwen3 \
   --speculative-algo NEXTN \
@@ -84,7 +86,7 @@ inputs = processor.apply_chat_template(
 ).to(model.device)
 generated_ids = model.generate(**inputs, max_new_tokens=32)
-output_text = processor.batch_decode(generated_ids[0])
 print(output_text)
 ```

 ```bash
 # Multi-token prediction is supported
 model_id=tiny-random/qwen3.5-moe
+python3 -m sglang.launch_server \
+  --model-path $model_id \
+  --tp-size 2 \
   --tool-call-parser qwen3_coder  \
   --reasoning-parser qwen3 \
   --speculative-algo NEXTN \
 ).to(model.device)
 generated_ids = model.generate(**inputs, max_new_tokens=32)
+output_text = processor.batch_decode(generated_ids[0][inputs['input_ids'].shape[1]:], skip_special_tokens=True)
 print(output_text)
 ```

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0aac8f1e5ef91b3c9c68c394611de2333b4e76fd229ef13864793d5826fa024c
 size 10057952

 version https://git-lfs.github.com/spec/v1
+oid sha256:3a68280ca252dadbb9875aa7455a9def12207fc29aa7bf34f10f578a4e4102cb
 size 10057952