leon-se
/

Aria-sequential_mlp-FP8-dynamic

Image-Text-to-Text

compressed-tensors

Model card Files Files and versions

Leon commited on Oct 23, 2024

Commit

e4dcfa0

·

verified ·

1 Parent(s): 50f77df

Update README.md

Files changed (1) hide show

README.md +2 -1

README.md CHANGED Viewed

@@ -8,7 +8,8 @@ library_name: transformers
 ---
 # Aria-sequential_mlp-FP8-dynamic
 FP8-Dynamic quantization from [Aria-sequential_mlp](https://huggingface.co/rhymes-ai/Aria-sequential_mlp) made with [llm-compressor](https://github.com/vllm-project/llm-compressor), requires about 24.8 GB of VRAM.
-### Installationcompressed-tensors
 ```
 pip install transformers==4.45.0 accelerate==0.34.1 sentencepiece==0.2.0 torchvision requests torch Pillow compressed-tensors
 pip install flash-attn --no-build-isolation

 ---
 # Aria-sequential_mlp-FP8-dynamic
 FP8-Dynamic quantization from [Aria-sequential_mlp](https://huggingface.co/rhymes-ai/Aria-sequential_mlp) made with [llm-compressor](https://github.com/vllm-project/llm-compressor), requires about 24.8 GB of VRAM.
+### Installation
 ```
 pip install transformers==4.45.0 accelerate==0.34.1 sentencepiece==0.2.0 torchvision requests torch Pillow compressed-tensors
 pip install flash-attn --no-build-isolation