RX 580 — Benchmarks e Configurações
Hardware
- GPU: RX 580 8GB VRAM
- Driver AMD: 31.0.21924.61
- Backend: Vulkan 1.4.341.1
Benchmarks LLM (llama.cpp + Vulkan)
| Modelo | Quantização | VRAM Uso | Tokens/s (aprox.) |
|---|---|---|---|
| Mistral 7B | Q4_K_M | ~5GB | ~8-12 t/s |
| Mistral 7B | Q5_K_M | ~6GB | ~6-9 t/s |
| Llama 3.1 8B | Q4_K_M | ~5.5GB | ~7-10 t/s |
Benchmarks Imagem (stable-diffusion.cpp + Vulkan)
| Modelo | Formato | Resolução | Tempo/imagem (aprox.) |
|---|---|---|---|
| Flux Schnell | GGUF | 512x512 | ~30-60s |
| SD 1.5 | GGUF | 512x512 | ~20-40s |
Observações
- Vulkan funcionando e estável
- GGUF muito mais leve que safetensors completos
- Priorizar quantizações Q4_K_M para melhor equilíbrio VRAM/qualidade
- Evitar modelos >7GB para não saturar VRAM
- Não usar ROCM — Vulkan é mais estável nessa GPU
Otimizações Recomendadas
--n-gpu-layers 35no llama.cpp (ajustar conforme modelo)--ctx-size 2048para economizar VRAM- Fechar outros processos antes de rodar modelos grandes