placebomancer's picture

2 3 2

placebomancer

placebomancer

·

AI & ML interests

None yet

Organizations

None yet

upvoted a paper 3 months ago

Evolution Strategies at Scale: LLM Fine-Tuning Beyond Reinforcement Learning

Paper • 2509.24372 • Published Sep 29, 2025 • 9

upvoted 2 papers 9 months ago

Offline Regularised Reinforcement Learning for Large Language Models Alignment

Paper • 2405.19107 • Published May 29, 2024 • 15

Concise Reasoning via Reinforcement Learning

Paper • 2504.05185 • Published Apr 7, 2025 • 2