Update README.md
Browse files
README.md
CHANGED
|
@@ -22,9 +22,11 @@ loss值收敛到了1以下(大佬说正常,虽然个人觉得有点过拟合
|
|
| 22 |

|
| 23 |

|
| 24 |
|
| 25 |
-
## 2、
|
| 26 |
|
| 27 |
-
|
|
|
|
|
|
|
| 28 |
|
| 29 |
由于上一个试水版本个人觉得有点过拟合(部分能力降低甚至丧失),所以这次loss值收敛不多,还在1.0以上,结果自我认知清洗不彻底,每次新的会话它都会胡说八道自己给自己上设定,虽然比上一个版本的输出表现更不稳定,但这种不稳定却是有趣得多,已作为我开发的一个AI聊天机器人后端模型之一
|
| 30 |
|
|
@@ -36,5 +38,3 @@ loss值收敛到了1以下(大佬说正常,虽然个人觉得有点过拟合
|
|
| 36 |

|
| 37 |
|
| 38 |
用来无聊打发时间很有趣。
|
| 39 |
-
|
| 40 |
-
## 3、
|
|
|
|
| 22 |

|
| 23 |

|
| 24 |
|
| 25 |
+
## 2、
|
| 26 |
|
| 27 |
+
## 3、RWKV-x060-World-1B6-v2.1-novel_extend_chris-nsfw.pth
|
| 28 |
+
|
| 29 |
+
在base模型RWKV-x060-World-1B6-v2.1-20240328-ctx4096的基础上做涩涩小说扩写指令微调后,使用自我认知数据继续微调5轮而成(对比了一下5、6、7轮的,综合来说这个泛化表现更有趣些)。
|
| 30 |
|
| 31 |
由于上一个试水版本个人觉得有点过拟合(部分能力降低甚至丧失),所以这次loss值收敛不多,还在1.0以上,结果自我认知清洗不彻底,每次新的会话它都会胡说八道自己给自己上设定,虽然比上一个版本的输出表现更不稳定,但这种不稳定却是有趣得多,已作为我开发的一个AI聊天机器人后端模型之一
|
| 32 |
|
|
|
|
| 38 |

|
| 39 |
|
| 40 |
用来无聊打发时间很有趣。
|
|
|
|
|
|