Open-LLM
全链路开源模型:至少包括模型(可能包括checkpoint)和数据
Text Generation • 16B • Updated • 4.64k • 653Note https://huggingface.co/collections/bigcode/starcoder2-65de6da6e87db3383572be1a https://huggingface.co/collections/bigcode/⭐-starcoder-64f9bd5740eb5daaeb81dbec
EleutherAI/pythia-12b
Text Generation • 12B • Updated • 16.1k • 141Note 全面开源,含种70M~12B之间16种不同size的模型,每个模型都提供训练中间过程的checkpoints; https://huggingface.co/collections/EleutherAI/pythia-scaling-suite-64fb5dfa8c21ebb3db7ad2e1
allenai/OLMo-7B
Text Generation • 7B • Updated • 1.21k • 650Note 全面开源,包括模型(含checkpoints)、数据集、训练评估代码、训练日志; https://huggingface.co/collections/allenai/olmo-suite-65aeaae8fe5b6b2122b46778
OpenCoder-LLM/OpenCoder-8B-Base-Checkpoints
Updated • 3 • 3Note 全面开源,包括模型(含checkpoints)、数据集(预训练、退火、微调阶段); https://huggingface.co/collections/infly/opencoder-672cec44bbb86c39910fb55e
allenai/OLMo-2-1124-13B
14B • Updated • 19.9k • 67Note 全面开源,包括模型(含checkpoints)、数据集(预训练、退火、SFT、DPO)、训练评估代码; https://huggingface.co/collections/allenai/olmo-2-674117b93ab84e98afc72edc
allenai/Olmo-3-32B-Think
Text Generation • 1.05M • Updated • 10.7k • • 163