SPES - a zjr2000 Collection

zjr2000 's Collections

updated Mar 9

Pretrained models for paper "Pretraining A Large Language Model using Distributed GPUs: A Memory-Efficient Decentralized Paradigm"