AISkywalker commited on
Commit
acd5c71
·
verified ·
1 Parent(s): 69f0504

Update README.md

Browse files

![TRPO_PPO_GRPO.png](https://cdn-uploads.huggingface.co/production/uploads/64e97ddd81e68021f065895b/RoULX_pXHSJUtbS2ZdgGt.png)
![图片1.png](https://cdn-uploads.huggingface.co/production/uploads/64e97ddd81e68021f065895b/LK2ncx91MOIltyWvLzfrE.png)

Files changed (1) hide show
  1. README.md +9 -1
README.md CHANGED
@@ -2,6 +2,14 @@
2
  license: mit
3
  datasets:
4
  - AISkywalker/music_poet
 
 
 
 
 
 
 
 
5
  --- 歌词生成系统
6
 
7
  AIGC创意文本生成,使用LoRA和强化学习进行微调。
@@ -50,4 +58,4 @@ python code/__main__.py
50
 
51
  1. 数据准备: 将训练数据放入data/文件夹
52
  2. 运行GRPO.ipynb进行模型训练
53
- 3. 训练好的模型会保存在对应模型文件夹
 
2
  license: mit
3
  datasets:
4
  - AISkywalker/music_poet
5
+ base_model:
6
+ - deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B
7
+ - Qwen/Qwen2.5-0.5B-Instruct
8
+ ---
9
+ ---
10
+ license: mit
11
+ datasets:
12
+ - AISkywalker/music_poet
13
  --- 歌词生成系统
14
 
15
  AIGC创意文本生成,使用LoRA和强化学习进行微调。
 
58
 
59
  1. 数据准备: 将训练数据放入data/文件夹
60
  2. 运行GRPO.ipynb进行模型训练
61
+ 3. 训练好的模型会保存在对应模型文件夹