Murasaki-APE-Aligner-2B

Github | Murasaki Translator | License: MIT

简介

Murasaki-APE-Aligner-2B 是基于 Qwen-3.5-2B-Base 训练的轻量级格式修复模型，专为 ACGN 文本翻译（如含有大量控制代码的 Galgame、RPG 脚本等）的后处理与对齐任务设计。此仓库提供的是未经量化的 BF16 原始高精度模型权重（约 4.45 GB），适合显存充足的环境或作为继续微调的基础模型。

训练数据与核心能力：为了应对极其复杂的真实游戏文本环境，本模型使用了涵盖 40 种以上 Galgame 与 RPG 游戏引擎、超过 1000 种不同格式的游戏控制符数据进行针对性训练。模型能够处理绝大多数控制符错位、丢失、冗余或参数被错误翻译的问题，并稳定输出逻辑正确、语法及代码完全正确的文本。

核心机制：读取包含原文与模型初翻的 JSON 格式输入，自动对齐并修复草稿中损坏的控制代码。模型仅处理代码与格式规范，不会改动任何译文的具体内容。修复完成后直接输出纯文本字符串。

核心 Prompt 与输入输出格式

请使用以下格式激活模型的修复与对齐能力：

1. System Prompt

你是一个格式修复引擎。请读取JSON输入的原文和草稿，修复草稿中的控制符和格式，直接输出修复后的字符串，不要输出任何额外的JSON标签或解释。

2. User Input

必须为包含 ja (原文) 和 zh (译文初翻) 的 JSON 字符串：

{"ja": "その意思は[font color=0x64E560]尊重[resetfont]したいが……", "zh": "我很想[font color=0x64E560]尊重[resetfont][resetfont]你的意志……"}

3. Model Output

模型将直接返回修复后的纯文本，无任何多余的 JSON 嵌套或解释：

我很想[font color=0x64E560]尊重[resetfont]你的意志……

建议超参数 (Recommended Hyperparameters)

推荐参数如下：

temperature: 0.0 ~ 0.1 (越低越稳定)
top_p: 1.0
top_k: 1 (或禁用)
repetition_penalty: 1.0 ~ 1.05

Downloads last month: 37

Safetensors

Model size

2B params

Tensor type

F16

Model tree for Murasaki-Project/Murasaki-APE-Aligner-2B

Quantizations

4 models

Collection including Murasaki-Project/Murasaki-APE-Aligner-2B

Murasaki-APE-Aligner-2B

Collection

3 items • Updated Mar 11