# RX 580 — Benchmarks e Configurações ## Hardware - GPU: RX 580 8GB VRAM - Driver AMD: 31.0.21924.61 - Backend: Vulkan 1.4.341.1 ## Benchmarks LLM (llama.cpp + Vulkan) | Modelo | Quantização | VRAM Uso | Tokens/s (aprox.) | |-----------------|-------------|----------|-------------------| | Mistral 7B | Q4_K_M | ~5GB | ~8-12 t/s | | Mistral 7B | Q5_K_M | ~6GB | ~6-9 t/s | | Llama 3.1 8B | Q4_K_M | ~5.5GB | ~7-10 t/s | ## Benchmarks Imagem (stable-diffusion.cpp + Vulkan) | Modelo | Formato | Resolução | Tempo/imagem (aprox.) | |------------------|---------|-----------|----------------------| | Flux Schnell | GGUF | 512x512 | ~30-60s | | SD 1.5 | GGUF | 512x512 | ~20-40s | ## Observações - Vulkan funcionando e estável - GGUF muito mais leve que safetensors completos - Priorizar quantizações Q4_K_M para melhor equilíbrio VRAM/qualidade - Evitar modelos >7GB para não saturar VRAM - Não usar ROCM — Vulkan é mais estável nessa GPU ## Otimizações Recomendadas - `--n-gpu-layers 35` no llama.cpp (ajustar conforme modelo) - `--ctx-size 2048` para economizar VRAM - Fechar outros processos antes de rodar modelos grandes