2.15 GB

Ctrl+K

1 contributor

Fix external_data.location: 'model.smoothed.int8.onnx.data' -> 'model.int8.onnx.data' so ORT can find the (renamed) .data file. The .data payload is unchanged.

5e2908e verified 2 months ago

.gitattributes

1.69 kB
fix: replace broken vanilla INT8 with SmoothQuant α=0.8 (cos_min 0.64 → 0.99) 2 months ago
README.md

4.48 kB
fix: replace broken vanilla INT8 with SmoothQuant α=0.8 (cos_min 0.64 → 0.99) 2 months ago
added_tokens.json

707 Bytes
Upload folder using huggingface_hub 4 months ago
config.json

1.35 kB
Upload folder using huggingface_hub 4 months ago
merges.txt

1.67 MB
Upload folder using huggingface_hub 4 months ago
model.int8.onnx

5.45 MB
xet

Fix external_data.location: 'model.smoothed.int8.onnx.data' -> 'model.int8.onnx.data' so ORT can find the (renamed) .data file. The .data payload is unchanged. 2 months ago
model.int8.onnx.data

1.06 GB
xet

init: Octen-Embedding-0.6B SmoothQuant INT8 ONNX (alpha=0.8, cos=~0.92 vs PyTorch ref) 2 months ago
model.int8.vanilla.onnx

5.45 MB
xet

fix: replace broken vanilla INT8 with SmoothQuant α=0.8 (cos_min 0.64 → 0.99) 2 months ago
model.int8.vanilla.onnx.data

1.06 GB
xet

fix: replace broken vanilla INT8 with SmoothQuant α=0.8 (cos_min 0.64 → 0.99) 2 months ago
quantize_octen_int8.py

5.67 kB
Upload folder using huggingface_hub 4 months ago
special_tokens_map.json

613 Bytes
Upload folder using huggingface_hub 4 months ago
tokenizer.json

11.4 MB
xet

Upload folder using huggingface_hub 4 months ago
tokenizer_config.json

5.4 kB
Upload folder using huggingface_hub 4 months ago
vocab.json

2.78 MB
Upload folder using huggingface_hub 4 months ago