GenomaLabs-com
/

kv-cache-eviction-mla

inference-optimization

Model card Files Files and versions

kv-cache-eviction-mla / notebooks

15.3 kB

Ctrl+K

Ctrl+K

4 contributors

History: 3 commits

GENOMA LABS / research

B3a-pivot: real Kimi K2.6 weights demo - eviction policy validated on actual MLA attention distribution

aac6c2e 16 days ago

01_smoke_test_walkthrough.md

5.19 kB
initial release: H2O KV cache eviction for DeepseekV3 / MLA architectures 17 days ago
02_validation_results.md

4.39 kB
B1 validation: multi-step eviction test + transformers compatibility note 17 days ago
03_kimi_real_weights_demo.md

5.71 kB
B3a-pivot: real Kimi K2.6 weights demo - eviction policy validated on actual MLA attention distribution 16 days ago