Spaces:

raylim
/

mosaic-zero

Running on Zero

App Files Files Community

raylim commited on Dec 8, 2025

Commit

e38c7e8

unverified ·

1 Parent(s): 3f232ad

Add flash-attn support for H100 acceleration

Browse files

- Add flash-attn>=2.5.0 for faster attention computation
- Pre-built wheels available for CUDA 12.1 + PyTorch 2.5
- Optimized for H100 Hopper architecture on HF Spaces
- Will significantly speed up Optimus (ViT) inference

Files changed (1) hide show

requirements.txt +1 -0

requirements.txt CHANGED Viewed

@@ -1,6 +1,7 @@
 --extra-index-url https://download.pytorch.org/whl/cu121
 torch>=2.0.0,<2.6
 torchvision>=0.15.0
 open-clip-torch
 gradio>=5.49.0
 loguru>=0.7.3

 --extra-index-url https://download.pytorch.org/whl/cu121
 torch>=2.0.0,<2.6
 torchvision>=0.15.0
+flash-attn>=2.5.0
 open-clip-torch
 gradio>=5.49.0
 loguru>=0.7.3