DotLM

tensorfiend 's Collections

updated May 30

SimpleThoughts data spans four stages—pretraining, SFT, alignment, and reasoning - training DotLM-165M to prioritize reasoning over memorization.