raphaelsty
/

model-test-onnx

@@ -16,14 +16,14 @@ ONNX export of [unknown](https://huggingface.co/unknown) for fast CPU inference.
 - **Source Model**: [unknown](https://huggingface.co/unknown)
 - **Embedding Dimension**: unknown
-- **Format**: ONNX (FP32)
 ## Files
 | File | Description |
 |------|-------------|
 | `model.onnx` | FP32 ONNX model |
 | `tokenizer.json` | Tokenizer configuration |
 | `config_sentence_transformers.json` | Model configuration |

 - **Source Model**: [unknown](https://huggingface.co/unknown)
 - **Embedding Dimension**: unknown
+- **Format**: ONNX (FP32 + INT8)
 ## Files
 | File | Description |
 |------|-------------|
 | `model.onnx` | FP32 ONNX model |
+| `model_int8.onnx` | INT8 quantized model (faster) |
 | `tokenizer.json` | Tokenizer configuration |
 | `config_sentence_transformers.json` | Model configuration |