tokenlabsdotrun
/

Llama-3.1-8B-Quanto-Int8

Text Generation

text-generation-inference

8-bit precision

Model card Files Files and versions

Llama-3.1-8B-Quanto-Int8 / tokenizer.json

Commit History

Upload Llama-3.1-8B quantized with quanto int8

c6aa61d
verified

genai2eliza commited on 9 days ago