Israa's picture

Israa

isrouush

·

AI & ML interests

Data Science, ML

Organizations

upvoted 2 articles over 1 year ago

Article

Fine-tuning SmolLM with Group Relative Policy Optimization (GRPO) by following the Methodologies

prithivMLmods

•

Feb 17, 2025

• 30

Article

Open-R1: a fully open reproduction of DeepSeek-R1

+1

eliebak, lvwerra, lewtun

•

Jan 28, 2025

• 889

upvoted a paper over 1 year ago

Aya Dataset: An Open-Access Collection for Multilingual Instruction Tuning

Paper • 2402.06619 • Published Feb 9, 2024 • 57