Quickpanda's picture

3 6

Quickpanda

Quickpanda

·

AI & ML interests

None yet

Organizations

None yet

upvoted a paper 5 months ago

Emergent temporal abstractions in autoregressive models enable hierarchical reinforcement learning

Paper • 2512.20605 • Published Dec 23, 2025 • 62

upvoted a paper about 1 year ago

A Minimalist Approach to LLM Reasoning: from Rejection Sampling to Reinforce

Paper • 2504.11343 • Published Apr 15, 2025 • 20

upvoted an article about 2 years ago

Article

Merge Large Language Models with mergekit

mlabonne

•

Jan 9, 2024

• 156