Inference Optimization

community

AI & ML interests

None defined yet.

Recent Activity

ChibuUkachi updated a model about 18 hours ago

RedHatAI/MiniMax-M2.5-quantized.w8a8

ChibuUkachi updated a model about 18 hours ago

RedHatAI/MiniMax-M2.5-NVFP4

ChibuUkachi updated a model about 18 hours ago

RedHatAI/MiniMax-M2.5-quantized.w4a16

View all activity

inference-optimization 's models 305

inference-optimization/Qwen3-30B-A3B-6.5-bits-mode-heuristic-per-tensor

25B • Updated 15 days ago • 49

inference-optimization/Qwen3-30B-A3B-6-bits-mode-noise-per-tensor

23B • Updated 15 days ago • 45

inference-optimization/Qwen3-30B-A3B-6-bits-mode-hybrid-per-tensor

23B • Updated 15 days ago • 52

inference-optimization/Qwen3-30B-A3B-6-bits-mode-heuristic-per-tensor

23B • Updated 15 days ago • 66

inference-optimization/Qwen3-30B-A3B-5.5-bits-mode-noise-per-tensor

21B • Updated 15 days ago • 48

inference-optimization/Qwen3-30B-A3B-5.5-bits-mode-hybrid-per-tensor

21B • Updated 15 days ago • 46

inference-optimization/Qwen3-30B-A3B-5.5-bits-mode-heuristic-per-tensor

21B • Updated 15 days ago • 42

inference-optimization/Qwen3-30B-A3B-5-bits-mode-noise-per-tensor

19B • Updated 15 days ago • 46

inference-optimization/Qwen3-30B-A3B-5-bits-mode-hybrid-per-tensor

19B • Updated 15 days ago • 48

inference-optimization/Qwen3-30B-A3B-5-bits-mode-heuristic-per-tensor

19B • Updated 15 days ago • 61

inference-optimization/Qwen3-8B-7-bits-mode-noise-per-tensor

6B • Updated 15 days ago • 64

inference-optimization/Qwen3-8B-7-bits-mode-hybrid-per-tensor

7B • Updated 15 days ago • 76

inference-optimization/Qwen3-8B-7-bits-mode-heuristic-per-tensor

7B • Updated 15 days ago • 78

inference-optimization/Qwen3-8B-6.5-bits-mode-noise-per-tensor

6B • Updated 15 days ago • 54

inference-optimization/Qwen3-8B-6.5-bits-mode-hybrid-per-tensor

7B • Updated 15 days ago • 51

inference-optimization/Qwen3-8B-6.5-bits-mode-heuristic-per-tensor

7B • Updated 15 days ago • 61

inference-optimization/Qwen3-8B-6-bits-mode-noise-per-tensor

6B • Updated 15 days ago • 51

inference-optimization/Qwen3-8B-6-bits-mode-hybrid-per-tensor

6B • Updated 15 days ago • 50

inference-optimization/Qwen3-8B-6-bits-mode-heuristic-per-tensor

6B • Updated 15 days ago • 54

inference-optimization/Qwen3-8B-5.5-bits-mode-noise-per-tensor

6B • Updated 15 days ago • 53

inference-optimization/Qwen3-8B-5.5-bits-mode-hybrid-per-tensor

6B • Updated 15 days ago • 53

inference-optimization/Qwen3-8B-5.5-bits-mode-heuristic-per-tensor

6B • Updated 15 days ago • 54

inference-optimization/Qwen3-8B-5-bits-mode-noise-per-tensor

6B • Updated 15 days ago • 51

inference-optimization/Qwen3-8B-5-bits-mode-hybrid-per-tensor

6B • Updated 15 days ago • 59

inference-optimization/Qwen3-8B-5-bits-mode-heuristic-per-tensor

6B • Updated 15 days ago • 54

inference-optimization/Llama-3.1-8B-Instruct-7-bits-mode-noise-per-tensor

7B • Updated 15 days ago • 41

inference-optimization/Llama-3.1-8B-Instruct-7-bits-mode-hybrid-per-tensor

7B • Updated 15 days ago • 38

inference-optimization/Llama-3.1-8B-Instruct-7-bits-mode-heuristic-per-tensor

7B • Updated 15 days ago • 44

inference-optimization/Llama-3.1-8B-Instruct-6.5-bits-mode-noise-per-tensor

7B • Updated 15 days ago • 37

inference-optimization/Llama-3.1-8B-Instruct-6.5-bits-mode-hybrid-per-tensor

7B • Updated 15 days ago • 52