hugfaceguy0001 commited on
Commit
6096cbf
·
verified ·
1 Parent(s): ca6f3dc

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +5 -3
README.md CHANGED
@@ -10,7 +10,7 @@ tags:
10
  ![](logo.png)
11
  # 轻小说写作模型(Alpha版)
12
 
13
- 本模型大小为0.1B,使用轻小说数据进行训练,可用于轻小说写作。
14
 
15
  ## 使用说明
16
 
@@ -69,7 +69,7 @@ python generate.py --prompt "写一篇轻小说,讲述少女组建乐队的故
69
  本模型使用标准的ChatML格式,目前只支持单轮对话,格式如下所示:
70
  ```
71
  <|im_start|>user
72
- 写一篇轻小说,讲述少女组建乐队的故事<<|im_end|>>
73
  <|im_start|>assistant
74
  # 序章:最后的希望
75
 
@@ -80,6 +80,8 @@ python generate.py --prompt "写一篇轻小说,讲述少女组建乐队的故
80
 
81
  准确来说,本模型总参数量为163,949,186.
82
 
 
 
83
  ## 训练说明
84
  使用脚本 `train_tokenizer.py` 训练tokenizer; 使用脚本 `pretrain.py` 预训练; 使用 `train_sft.py` 进行指令微调。
85
  训练和推理需要安装的python包有pytorch, jsonlines, tqdm等,不依赖于transformers等huggingface框架。
@@ -92,4 +94,4 @@ python generate.py --prompt "写一篇轻小说,讲述少女组建乐队的故
92
  [zhihu-KOL](https://huggingface.co/datasets/wangrui6/Zhihu-KOL)
93
  本人收集的一些轻小说和其他小说数据
94
 
95
- 本模型SFT数据是使用deepseek v4 pro生成的1000条小说创作数据集
 
10
  ![](logo.png)
11
  # 轻小说写作模型(Alpha版)
12
 
13
+ 本模型大小为0.16B,使用轻小说数据进行训练,可用于轻小说写作。
14
 
15
  ## 使用说明
16
 
 
69
  本模型使用标准的ChatML格式,目前只支持单轮对话,格式如下所示:
70
  ```
71
  <|im_start|>user
72
+ 写一篇轻小说,讲述少女组建乐队的故事<|im_end|>
73
  <|im_start|>assistant
74
  # 序章:最后的希望
75
 
 
80
 
81
  准确来说,本模型总参数量为163,949,186.
82
 
83
+ 训练时的序列长度为2048,超出该长度的生成效果可能会大幅度下降。
84
+
85
  ## 训练说明
86
  使用脚本 `train_tokenizer.py` 训练tokenizer; 使用脚本 `pretrain.py` 预训练; 使用 `train_sft.py` 进行指令微调。
87
  训练和推理需要安装的python包有pytorch, jsonlines, tqdm等,不依赖于transformers等huggingface框架。
 
94
  [zhihu-KOL](https://huggingface.co/datasets/wangrui6/Zhihu-KOL)
95
  本人收集的一些轻小说和其他小说数据
96
 
97
+ 本模型SFT数据是使用deepseek v4 pro生成的1018条小说创作[数据集](https://huggingface.co/datasets/hugfaceguy0001/LightNovel-SFT)