dolfsai
/

Qwen3-Embedding-0.6B-vllm-W8A8

Feature Extraction

8-bit precision

compressed-tensors

Model card Files Files and versions

prudant commited on Aug 17

Commit

c11530c

·

verified ·

1 Parent(s): 0b4f016

Update README.md

Files changed (1) hide show

README.md +12 -1

README.md CHANGED Viewed

@@ -1,3 +1,14 @@
 # prudant/Qwen3-Embedding-0.6B-W8A8
@@ -10,4 +21,4 @@ This is a compressed version of Qwen/Qwen3-Embedding-0.6B using llm-compressor w
 - **Compression Libraries**: [llm-compressor](https://github.com/vllm-project/llm-compressor)
 - **Calibration Dataset**: ultrachat_200k (1024 samples)
 - **Optimized For**: Inference with vLLM
-- **License**: same as original model

+---
+license: apache-2.0
+datasets:
+- HuggingFaceH4/ultrachat_200k
+language:
+- en
+- es
+base_model:
+- Qwen/Qwen3-Embedding-0.6B
+pipeline_tag: feature-extraction
+---
 # prudant/Qwen3-Embedding-0.6B-W8A8
 - **Compression Libraries**: [llm-compressor](https://github.com/vllm-project/llm-compressor)
 - **Calibration Dataset**: ultrachat_200k (1024 samples)
 - **Optimized For**: Inference with vLLM
+- **License**: same as original model