Update README.md
Browse files
README.md
CHANGED
|
@@ -134,4 +134,4 @@ while True:
|
|
| 134 |
|
| 135 |
由于模型参数相对较少,在某些任务上可能会出现性能不足的情况,比如对复杂语言现象的理解能力可能不如更大规模的模型。此外,较小的模型也可能更容易过拟合训练数据,导致泛化能力较差。不过,这也意味着该模型可以在较低配置的硬件上运行,并且训练时间相对较短。
|
| 136 |
|
| 137 |
-
|
|
|
|
| 134 |
|
| 135 |
由于模型参数相对较少,在某些任务上可能会出现性能不足的情况,比如对复杂语言现象的理解能力可能不如更大规模的模型。此外,较小的模型也可能更容易过拟合训练数据,导致泛化能力较差。不过,这也意味着该模型可以在较低配置的硬件上运行,并且训练时间相对较短。
|
| 136 |
|
| 137 |
+
目前模型已经完成 pre-train + SFT + DPO 的流程, 相应的训练代码也存储在了项目当中
|