Inference Optimization

community

AI & ML interests

None defined yet.

Recent Activity

ChibuUkachi updated a model about 10 hours ago

RedHatAI/MiniMax-M2.5-quantized.w8a8

ChibuUkachi updated a model about 10 hours ago

RedHatAI/MiniMax-M2.5-NVFP4

ChibuUkachi updated a model about 10 hours ago

RedHatAI/MiniMax-M2.5-quantized.w4a16

View all activity

inference-optimization 's models 305

inference-optimization/gpt-oss-120b-from-self-ckpt3-speculator.eagle3

0.9B • Updated Mar 25 • 2

inference-optimization/gpt-oss-120b-from-self-ckpt4-speculator.eagle3

0.9B • Updated Mar 25 • 2

inference-optimization/gpt-oss-120b-from-self-ckpt2-speculator.eagle3

0.9B • Updated Mar 25 • 3

inference-optimization/gpt-oss-120b-from-self-ckpt1-speculator.eagle3

0.9B • Updated Mar 25 • 1

inference-optimization/gpt-oss-120b-from-self-ckpt0-speculator.eagle3

0.9B • Updated Mar 25 • 1

inference-optimization/Qwen3-Next-80B-A3B-Instruct-GSM8K-MTP-finetuned

81B • Updated Mar 25 • 25

inference-optimization/Qwen3-Next-80B-A3B-Instruct_mtp_speculator_new

inference-optimization/Qwen3-30B-from-Qwen3-235B_resps-speculators.eagle3-ckpt3

0.5B • Updated Mar 25

inference-optimization/gpt-oss-120b-from-qwen235b-ckpt3-speculator.eagle3

0.9B • Updated Mar 25 • 2

inference-optimization/gpt-oss-120b-from-qwen235b-ckpt1-speculator.eagle3

0.9B • Updated Mar 25 • 2

inference-optimization/gpt-oss-120b-from-qwen235b-ckpt0-speculator.eagle3

0.9B • Updated Mar 25

inference-optimization/Qwen3-30B-from-Qwen3-235B_resps-speculators.eagle3-ckpt2

0.5B • Updated Mar 25

inference-optimization/Qwen3-30B-from-Qwen3-235B_resps-speculators.eagle3-ckpt1

0.5B • Updated Mar 25

inference-optimization/Qwen3-32B-from-self-speculators.eagle3-ckpt5

2B • Updated Mar 25 • 1

inference-optimization/Qwen3-30B-from-self-speculators.eagle3-ckpt5

0.5B • Updated Mar 24 • 1

inference-optimization/Qwen3-32B-from-self-speculators.eagle3-ckpt4

2B • Updated Mar 24 • 1

inference-optimization/Qwen3-32B-from-self-speculators.eagle3-ckpt3

2B • Updated Mar 24

inference-optimization/Qwen3-30B-from-self-speculators.eagle3-ckpt1

0.5B • Updated Mar 24 • 3

inference-optimization/Qwen3-32B-from-self-speculators.eagle3-ckpt2

2B • Updated Mar 24 • 1

inference-optimization/Qwen3-32B-from-self-speculators.eagle3-ckpt1

2B • Updated Mar 24

inference-optimization/Qwen3-32B-from-self-speculators.eagle3-ckpt0

2B • Updated Mar 24 • 2

inference-optimization/Qwen3-30B-from-self-speculators.eagle3-ckpt0

0.5B • Updated Mar 24

inference-optimization/llama3_8b_sharegpt_5k

inference-optimization/Qwen3-30B-from-self-speculators.eagle3-ckpt2

0.5B • Updated Mar 24

inference-optimization/Qwen3-30B-from-self-speculators.eagle3-ckpt3

0.5B • Updated Mar 24 • 1

inference-optimization/Qwen3-30B-from-self-speculators.eagle3-ckpt4

0.5B • Updated Mar 24

inference-optimization/Qwen3-30B-from-Qwen3-235B_resps-speculators.eagle3-ckpt4

0.5B • Updated Mar 23 • 2

inference-optimization/Qwen3-30B-from-Qwen3-235B_resps-speculators.eagle3-ckpt5

0.5B • Updated Mar 23 • 1

inference-optimization/Qwen3-30B-from-Qwen3-235B_resps-speculators.eagle3-ckpt0

0.5B • Updated Mar 23 • 1

inference-optimization/Qwen3-Coder-Next.w8a8

Text Generation • 80B • Updated Mar 23 • 45