rinne1998 commited on
Commit
e15630f
·
verified ·
1 Parent(s): e492ffb

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +2 -9
README.md CHANGED
@@ -26,17 +26,14 @@ Orion - 针对轻小说场景训练、优化的翻译模型
26
 
27
  ### 正在进行
28
  * Qwen3 1.7B 大规模继续预训练(CPT)
29
- * 收集和构建动漫字幕、游戏文本平行语料
30
- * Qwen3 8B-Base 模型微调(SFT阶段)
31
  * 构建高质量偏好对齐数据集
32
  * 训练轻小说领域的翻译质量评估模型(LightComet)
33
 
34
  ### 即将进行
35
- * HunYuan MT1.5-1.8B/7B 模型偏好对齐
36
- * Qwen3 1.7B/4B/8B-Base 模型偏好对齐
37
 
38
  ### 后续计划
39
- * Qwen3 14B 微调
40
 
41
 
42
  训练数据持续更新、优化中……
@@ -48,7 +45,3 @@ Orion - 针对轻小说场景训练、优化的翻译模型
48
  * 2025-09~2025-12 轻小说文档数据清洗、配对完成,NER模型[Orion-NER-110M-v1](https://huggingface.co/3tic/Orion-NER-110M-v1)训练完成
49
  * 2026-01~现在 训练数据准备完成,模型训练中
50
 
51
- 预计2026年1月内完成第一批模型训练,届时将上传模型权重,同时开放训练数据(原始平行语句数据、模型训练用数据)、训练命令以及过程信息。
52
-
53
- 相关交流学习/建议:```QQ Group 107#746#955#1```
54
-
 
26
 
27
  ### 正在进行
28
  * Qwen3 1.7B 大规模继续预训练(CPT)
 
 
29
  * 构建高质量偏好对齐数据集
30
  * 训练轻小说领域的翻译质量评估模型(LightComet)
31
 
32
  ### 即将进行
33
+ * HunYuan MT1.5-1.8B 模型偏好对齐
34
+ * Qwen3 1.7B 模型偏好对齐
35
 
36
  ### 后续计划
 
37
 
38
 
39
  训练数据持续更新、优化中……
 
45
  * 2025-09~2025-12 轻小说文档数据清洗、配对完成,NER模型[Orion-NER-110M-v1](https://huggingface.co/3tic/Orion-NER-110M-v1)训练完成
46
  * 2026-01~现在 训练数据准备完成,模型训练中
47