基于Qwen3微调版本
3tic-project
community
AI & ML interests
Machine Translation
Recent Activity
Organization Card
Orion - 针对轻小说场景训练、优化的翻译模型
20260327更新:Orion-Qwen3-1.7B-SFT-v2605 训练完成,轻量且效果较好,推荐使用此模型!
已完成
- 收集轻小说语料:90000+本日文轻小说档案,16000+本中文翻译档案
- 日版-翻译档配对:10000+对
- 日-中翻译对:33M+对
- SFT训练数据:9M+条
- CPT训练数据:~80B+字符
- NER模型:Orion-NER-110M-v1已上传权重和训练数据
正在进行
- 构建高质量偏好对齐数据集
- 训练轻小说领域的翻译质量评估模型(LightComet)
即将进行
- Qwen3 1.7B 模型偏好对齐
训练数据持续更新、优化中……
========================================
Timeline
- 2025-02 开坑
- 2025-04~2025-08 90000+本轻小说文档库构建完成
- 2025-09~2025-12 轻小说文档数据清洗、配对完成,NER模型Orion-NER-110M-v1训练完成
- 2026-01 HunYuan MT1.5-1.8B 训练完成
- 2026-02~2026.03 Qwen3 1.7B 大规模继续预训练完成
- 2026.03 Qwen3-1.7B-SFT 训练完成
- 2026.03~现在 Qwen3 1.7B 模型RL训练阶段
- 2026.04 Qwen3-1.7B-CPT-v2604 大规模继续预训练完成
- 2026.05 Qwen3-4B-CPT-v2605 大规模继续预训练完成
- 2026.05 Qwen3-1.7B-SFT-v2605 大规模继续预训练完成
- 2026.05 Qwen3-4B-SFT-v2605 大规模继续预训练完成
models 13
3tic/Orion-Qwen3-4B-SFT-v2605
Text Generation • 196k • Updated • 34
3tic/Orion-Qwen3-1.7B-SFT-v2605
Text Generation • 2B • Updated • 33
3tic/Orion-Qwen3-4B-CPT-v2605
Text Generation • 196k • Updated • 22 • 1
3tic/Orion-Qwen3-1.7B-CPT-v2604
Text Generation • 2B • Updated • 237 •
3tic/Orion-Qwen3-1.7B-SFT-v2603
Text Generation • 2B • Updated • 17 •
3tic/Orion-Qwen3-1.7B-CPT-v2603
Text Generation • 2B • Updated • 18 • • 1
3tic/Orion-Qwen3.5-2B-SFT-v2603-v1
3B • Updated • 10
3tic/Orion-Qwen3.5-2B-CPT-v2603-v1
Text Generation • 2B • Updated • 10 • 2
3tic/Orion-Qwen3-4B-SFT-v2601
Translation • 4B • Updated • 11
3tic/Orion-HYMT1.5-1.8B-SFT-v2601
Translation • 2B • Updated • 4 • 2