File size: 223 Bytes
bc2cf94
 
 
 
a64e147
1
2
3
4
5
---
license: apache-2.0
---
目前是基于一个GPU训练的版本,架构采用Yarn,GQA,MOE(可选),
预训练和后训练(SFT和GRPO)的数据包含文本,代码,图像。目前是没有图文训练过程。