Pré-treino continuado utilizando a Wikipédia em português por 40 épocas.
Treinado por 74 horas em uma NVIDIA H100 80GB.
Files info
Base model