De Francesco Nazareno

nazdef

1 3

·

AI & ML interests

LLM pretraining from scratch, single-GPU training, bilingual EN/IT models, Supervised finetuning SFT, Reinforcement learning GRPO/GSPO

Recent Activity

updated a model about 8 hours ago

nazdef/gpt2medium-en-it-nanochat-gpt2preln-decay13500-step14700

published a model about 8 hours ago

nazdef/gpt2medium-en-it-nanochat-gpt2preln-decay13500-step14700

updated a model about 8 hours ago

nazdef/gpt2medium-en-it-nanochat-gpt2preln-decay13500-step14500

View all activity

Organizations

None yet

upvoted an article over 1 year ago

Article

Open-R1: a fully open reproduction of DeepSeek-R1

+1

eliebak, lvwerra, lewtun

•

Jan 28, 2025

• 889