guankoala's picture

1 3

guankoala

guankoala

·

purekoala

AI & ML interests

None yet

Recent Activity

upvoted a paper 1 day ago

HySparse: A Hybrid Sparse Attention Architecture with Oracle Token Selection and KV Cache Sharing

liked a Space 12 months ago

nanotron/ultrascale-playbook

liked a model over 1 year ago

medxiaorudan/CodeLlama_CPP_FineTuned

View all activity

Organizations

None yet

upvoted a paper 1 day ago

HySparse: A Hybrid Sparse Attention Architecture with Oracle Token Selection and KV Cache Sharing

Paper • 2602.03560 • Published 3 days ago • 37

liked a Space 12 months ago

The Ultra-Scale Playbook

The ultimate guide to training LLM on large GPU Clusters

liked 2 models over 1 year ago

medxiaorudan/CodeLlama_CPP_FineTuned

Updated Jan 24, 2024 • 2 • 1

ajibawa-2023/Code-Llama-3-8B

Text Generation • 8B • Updated May 8, 2024 • 1.59k • 31