Spaces:

3tic
/

README

Running

rinne1998 commited on Jan 11

Commit

9709168

verified ·

1 Parent(s): 4ee083d

Update README.md

Files changed (1) hide show

README.md CHANGED Viewed

@@ -9,23 +9,36 @@ pinned: false
 Orion - 针对轻小说场景训练、优化的翻译模型
-## 已完成
 * 收集轻小说语料：70000+本日文轻小说档案，16000+本中文翻译档案
 * 日版-翻译档配对：3000+对
 * 日-中翻译对：9,800,000对
 * 训练数据合成：9,000,000+行，约7,150,000,000+字符
-## 正在进行
 * HunYuan MT1.5-1.8B 模型微调（SFT阶段）
 * HunYuan MT1.5-7B 模型微调（SFT阶段）
-## 即将进行
-* HunYuan MT1.5-1.8B 模型对齐（DPO/GRPO阶段）
-* HunYuan MT1.5-7B 模型对齐（DPO/GRPO阶段）
-## 后续计划
 * Qwen3 1.7B/4B/8B/14B系列 微调
 * Seed-X系列 微调
-训练数据持续更新、优化中……

 Orion - 针对轻小说场景训练、优化的翻译模型
+### 已完成
 * 收集轻小说语料：70000+本日文轻小说档案，16000+本中文翻译档案
 * 日版-翻译档配对：3000+对
 * 日-中翻译对：9,800,000对
 * 训练数据合成：9,000,000+行，约7,150,000,000+字符
+### 正在进行
 * HunYuan MT1.5-1.8B 模型微调（SFT阶段）
 * HunYuan MT1.5-7B 模型微调（SFT阶段）
+### 即将进行
+* HunYuan MT1.5-1.8B 模型偏好对齐（DPO/GRPO阶段）
+* HunYuan MT1.5-7B 模型偏好对齐（DPO/GRPO阶段）
+### 后续计划
 * Qwen3 1.7B/4B/8B/14B系列 微调
 * Seed-X系列 微调
+训练数据持续更新、优化中……
+========================================
+#### Timeline
+* 2025-02 开坑
+* 2025-04~2025-08 90000+本轻小说文档库构建完成 (https://epub.moe)
+* 2025-09~2025-12 轻小说文档数据清洗、配对完成
+* 2026-01~现在 训练数据准备完成，模型训练中
+预计2026年1月中旬完成第一批模型训练，届时将上传模型权重，同时开放训练数据（原始平行语句数据、模型训练用数据）、训练命令以及过程信息。
+相关交流学习/建议：```QQ Group 107#746#955#1```