Red Hat AI

company

Verified

https://www.redhat.com/en/products/ai

AI & ML interests

OpenSource and AI

Recent Activity

robgreenberg3 updated a model about 19 hours ago

RedHatAI/Laguna-XS.2-NVFP4

robgreenberg3 updated a model about 19 hours ago

RedHatAI/Laguna-XS.2-FP8

robgreenberg3 updated a model about 19 hours ago

RedHatAI/Qwen3-VL-30B-A3B-Instruct

View all activity

Papers

SNLP: Layer-Parallel Inference via Structured Newton Corrections

S2D2: Fast Decoding for Diffusion LLMs via Training-Free Self-Speculation

View all Papers

RedHatAI 's models 694

RedHatAI/Sparse-Llama-3.1-8B-gsm8k-2of4-quantized.w4a16

Text Generation • 2B • Updated Dec 19, 2024 • 7

RedHatAI/Sparse-Llama-3.1-8B-ultrachat_200k-2of4-quantized.w4a16

Text Generation • 2B • Updated Dec 19, 2024 • 20 • 3

RedHatAI/Sparse-Llama-3.1-8B-evolcodealpaca-2of4-quantized.w4a16

Text Generation • 2B • Updated Dec 19, 2024 • 16

RedHatAI/Qwen2.5-3B-quantized.w4a16

Text Generation • 3B • Updated Dec 17, 2024 • 40

RedHatAI/Qwen2.5-1.5B-quantized.w4a16

Text Generation • 2B • Updated Dec 17, 2024 • 83

RedHatAI/Qwen2.5-0.5B-quantized.w4a16

Text Generation • 0.6B • Updated Dec 17, 2024 • 115

RedHatAI/Qwen2.5-14B-Instruct-quantized.w8a8

Text Generation • 15B • Updated Dec 17, 2024 • 223

RedHatAI/granite-3.1-8b-instruct-GGUF

8B • Updated Dec 17, 2024 • 5

RedHatAI/Sparse-Llama-3.1-8B-2of4

Text Generation • 8B • Updated Dec 16, 2024 • 705 • • 62

RedHatAI/Qwen2.5-Math-7B-Instruct-FP8-dynamic

8B • Updated Dec 11, 2024 • 5

RedHatAI/Qwen2.5-0.5B-Instruct-quantized.w8a8

Text Generation • 0.6B • Updated Dec 9, 2024 • 126

RedHatAI/Qwen2.5-72B-FP8-dynamic

Text Generation • 73B • Updated Dec 3, 2024 • 52 • 1

RedHatAI/Qwen2.5-72B-quantized.w8a8

Text Generation • 73B • Updated Dec 3, 2024 • 9

RedHatAI/Qwen2.5-14B-quantized.w8a8

Text Generation • 15B • Updated Dec 3, 2024 • 9 • 2

RedHatAI/Qwen2.5-14B-FP8-dynamic

Text Generation • 15B • Updated Dec 3, 2024 • 115 • 2

RedHatAI/Qwen2.5-7B-quantized.w8a8

Text Generation • 8B • Updated Dec 3, 2024 • 50 • 1

RedHatAI/Qwen2.5-3B-FP8-dynamic

Text Generation • 3B • Updated Dec 3, 2024 • 99

RedHatAI/Qwen2.5-1.5B-FP8-dynamic

Text Generation • 2B • Updated Dec 3, 2024 • 29

RedHatAI/Qwen2.5-0.5B-FP8-dynamic

Text Generation • 0.6B • Updated Dec 3, 2024 • 243

RedHatAI/Qwen2.5-3B-quantized.w8a8

Text Generation • 3B • Updated Dec 3, 2024 • 9 • 1

RedHatAI/Qwen2.5-1.5B-quantized.w8a8

Text Generation • 2B • Updated Dec 3, 2024 • 1.07M • 4

RedHatAI/Qwen2.5-0.5B-quantized.w8a8

Text Generation • 0.6B • Updated Dec 3, 2024 • 406

RedHatAI/Meta-Llama-3.1-405B-Instruct-quantized.w8a8

Text Generation • 406B • Updated Dec 3, 2024 • 19 • 2

RedHatAI/Qwen2.5-14B-Instruct-FP8-dynamic

15B • Updated Dec 2, 2024 • 33k

RedHatAI/Qwen2.5-72B-Instruct-FP8-dynamic

73B • Updated Dec 2, 2024 • 22.5k • 3

RedHatAI/Qwen2.5-Coder-7B-FP8-dynamic

8B • Updated Nov 28, 2024 • 26

RedHatAI/Qwen2.5-Coder-7B-Instruct-FP8-dynamic

8B • Updated Nov 28, 2024 • 657

RedHatAI/Qwen2.5-Math-7B-FP8-dynamic

8B • Updated Nov 28, 2024 • 7

RedHatAI/Qwen2.5-Coder-14B-FP8-dynamic

15B • Updated Nov 28, 2024 • 8

RedHatAI/Qwen2.5-Coder-32B-Instruct-FP8-dynamic

33B • Updated Nov 28, 2024 • 120k