AI & ML interests

Machine Translation

Recent Activity

rinne1998  updated a model 6 days ago
3tic/Orion-Qwen3-4B-SFT-v2605
rinne1998  published a model 6 days ago
3tic/Orion-Qwen3-4B-SFT-v2605
rinne1998  updated a Space 6 days ago
3tic/README
View all activity

Organization Card

Orion - 针对轻小说场景训练、优化的翻译模型

20260327更新:Orion-Qwen3-1.7B-SFT-v2605 训练完成,轻量且效果较好,推荐使用此模型!

已完成

  • 收集轻小说语料:90000+本日文轻小说档案,16000+本中文翻译档案
  • 日版-翻译档配对:10000+对
  • 日-中翻译对:33M+对
  • SFT训练数据:9M+条
  • CPT训练数据:~80B+字符
  • NER模型:Orion-NER-110M-v1已上传权重和训练数据

正在进行

  • 构建高质量偏好对齐数据集
  • 训练轻小说领域的翻译质量评估模型(LightComet)

即将进行

  • Qwen3 1.7B 模型偏好对齐

训练数据持续更新、优化中……

========================================

Timeline

  • 2025-02 开坑
  • 2025-04~2025-08 90000+本轻小说文档库构建完成
  • 2025-09~2025-12 轻小说文档数据清洗、配对完成,NER模型Orion-NER-110M-v1训练完成
  • 2026-01 HunYuan MT1.5-1.8B 训练完成
  • 2026-02~2026.03 Qwen3 1.7B 大规模继续预训练完成
  • 2026.03 Qwen3-1.7B-SFT 训练完成
  • 2026.03~现在 Qwen3 1.7B 模型RL训练阶段
  • 2026.04 Qwen3-1.7B-CPT-v2604 大规模继续预训练完成
  • 2026.05 Qwen3-4B-CPT-v2605 大规模继续预训练完成
  • 2026.05 Qwen3-1.7B-SFT-v2605 大规模继续预训练完成
  • 2026.05 Qwen3-4B-SFT-v2605 大规模继续预训练完成