Update README.md
Browse files
README.md
CHANGED
|
@@ -14,10 +14,11 @@ Orion - 针对轻小说场景训练、优化的翻译模型
|
|
| 14 |
* 日版-翻译档配对:3000+对
|
| 15 |
* 日-中翻译对:9,800,000对
|
| 16 |
* 训练数据合成:9,000,000+行,约7,150,000,000+字符
|
|
|
|
| 17 |
|
| 18 |
### 正在进行
|
| 19 |
-
* HunYuan MT1.5-1.8B 模型微调(SFT阶段)
|
| 20 |
-
* HunYuan MT1.5-7B 模型微调(SFT阶段)
|
| 21 |
|
| 22 |
### 即将进行
|
| 23 |
* HunYuan MT1.5-1.8B 模型偏好对齐(DPO/GRPO阶段)
|
|
@@ -33,8 +34,8 @@ Orion - 针对轻小说场景训练、优化的翻译模型
|
|
| 33 |
========================================
|
| 34 |
#### Timeline
|
| 35 |
* 2025-02 开坑
|
| 36 |
-
* 2025-04~2025-08 90000+本轻小说文档库构建完成
|
| 37 |
-
* 2025-09~2025-12 轻小说文档数据清洗、配对完成
|
| 38 |
* 2026-01~现在 训练数据准备完成,模型训练中
|
| 39 |
|
| 40 |
|
|
|
|
| 14 |
* 日版-翻译档配对:3000+对
|
| 15 |
* 日-中翻译对:9,800,000对
|
| 16 |
* 训练数据合成:9,000,000+行,约7,150,000,000+字符
|
| 17 |
+
* NER模型:[Orion-NER-110M-v1](https://huggingface.co/3tic/Orion-NER-110M-v1)已上传权重和训练数据
|
| 18 |
|
| 19 |
### 正在进行
|
| 20 |
+
* [HunYuan MT1.5-1.8B](https://huggingface.co/3tic/Orion-HYMT1.5-1.8B-SFT-v2601) 模型微调(SFT阶段)
|
| 21 |
+
* [HunYuan MT1.5-7B](https://huggingface.co/3tic/Orion-HYMT1.5-7B-SFT-v2601) 模型微调(SFT阶段)
|
| 22 |
|
| 23 |
### 即将进行
|
| 24 |
* HunYuan MT1.5-1.8B 模型偏好对齐(DPO/GRPO阶段)
|
|
|
|
| 34 |
========================================
|
| 35 |
#### Timeline
|
| 36 |
* 2025-02 开坑
|
| 37 |
+
* 2025-04~2025-08 90000+本轻小说文档库构建完成
|
| 38 |
+
* 2025-09~2025-12 轻小说文档数据清洗、配对完成,NER模型[Orion-NER-110M-v1](https://huggingface.co/3tic/Orion-NER-110M-v1)训练完成
|
| 39 |
* 2026-01~现在 训练数据准备完成,模型训练中
|
| 40 |
|
| 41 |
|