ZhenyuanGuo's picture

ZhenyuanGuo

YuanZ77

·

AI & ML interests

LLM

Organizations

upvoted a paper over 1 year ago

Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention

Paper • 2502.11089 • Published Feb 16, 2025 • 170

upvoted a collection over 1 year ago

Deepseek Papers

Deepseek papers collection • 32 items • Updated 6 days ago • 352

upvoted an article almost 2 years ago

Article

Fine-tuning 20B LLMs with RLHF on a 24GB consumer GPU

+4

edbeeching, ybelkada, lvwerra, smangrul, lewtun, kashif

•

Mar 9, 2023

• 72

upvoted a paper almost 2 years ago

Internal Consistency and Self-Feedback in Large Language Models: A Survey

Paper • 2407.14507 • Published Jul 19, 2024 • 48