Spaces:

Alovestocode
/

ZeroGPU-LLM-Inference

Sleeping

App Files Files Community

ZeroGPU-LLM-Inference / requirements.txt

Alikestocode's picture

Migrate to AWQ quantization with FlashAttention-2

06b4cf5 6 months ago

164 Bytes

	wheel
	streamlit
	ddgs
	gradio>=5.0.0
	torch>=2.8.0
	transformers>=4.53.3
	spaces
	sentencepiece
	accelerate
	autoawq
	flash-attn>=2.5.0
	timm
	compressed-tensors
	bitsandbytes