| # RX 580 — Benchmarks e Configurações | |
| ## Hardware | |
| - GPU: RX 580 8GB VRAM | |
| - Driver AMD: 31.0.21924.61 | |
| - Backend: Vulkan 1.4.341.1 | |
| ## Benchmarks LLM (llama.cpp + Vulkan) | |
| | Modelo | Quantização | VRAM Uso | Tokens/s (aprox.) | | |
| |-----------------|-------------|----------|-------------------| | |
| | Mistral 7B | Q4_K_M | ~5GB | ~8-12 t/s | | |
| | Mistral 7B | Q5_K_M | ~6GB | ~6-9 t/s | | |
| | Llama 3.1 8B | Q4_K_M | ~5.5GB | ~7-10 t/s | | |
| ## Benchmarks Imagem (stable-diffusion.cpp + Vulkan) | |
| | Modelo | Formato | Resolução | Tempo/imagem (aprox.) | | |
| |------------------|---------|-----------|----------------------| | |
| | Flux Schnell | GGUF | 512x512 | ~30-60s | | |
| | SD 1.5 | GGUF | 512x512 | ~20-40s | | |
| ## Observações | |
| - Vulkan funcionando e estável | |
| - GGUF muito mais leve que safetensors completos | |
| - Priorizar quantizações Q4_K_M para melhor equilíbrio VRAM/qualidade | |
| - Evitar modelos >7GB para não saturar VRAM | |
| - Não usar ROCM — Vulkan é mais estável nessa GPU | |
| ## Otimizações Recomendadas | |
| - `--n-gpu-layers 35` no llama.cpp (ajustar conforme modelo) | |
| - `--ctx-size 2048` para economizar VRAM | |
| - Fechar outros processos antes de rodar modelos grandes | |