Update README.md

Files changed (1) hide show

README.md CHANGED Viewed

@@ -134,4 +134,4 @@ while True:
 由于模型参数相对较少，在某些任务上可能会出现性能不足的情况，比如对复杂语言现象的理解能力可能不如更大规模的模型。此外，较小的模型也可能更容易过拟合训练数据，导致泛化能力较差。不过，这也意味着该模型可以在较低配置的硬件上运行，并且训练时间相对较短。
-另外目前给定的权重仅仅完成了 preTrain + SFT (也就是说训练流程并非完整的)， 之后在完成DPO/PPO 训练之后会更新权重和readme


134
135	由于模型参数相对较少，在某些任务上可能会出现性能不足的情况，比如对复杂语言现象的理解能力可能不如更大规模的模型。此外，较小的模型也可能更容易过拟合训练数据，导致泛化能力较差。不过，这也意味着该模型可以在较低配置的硬件上运行，并且训练时间相对较短。
136
137	+ 目前模型已经完成 pre-train + SFT + DPO 的流程，相应的训练代码也存储在了项目当中