Murasaki-APE-Aligner-2B
Collection
3 items • Updated
自动化后处理 · 控制符修复模型
Github | Murasaki Translator | License: MIT
Other Versions:AWQ (4-bit) | GGUF
Murasaki-APE-Aligner-2B 是基于 Qwen-3.5-2B-Base 训练的轻量级格式修复模型,专为 ACGN 文本翻译(如含有大量控制代码的 Galgame、RPG 脚本等)的后处理与对齐任务设计。此仓库提供的是未经量化的 BF16 原始高精度模型权重(约 4.45 GB),适合显存充足的环境或作为继续微调的基础模型。
训练数据与核心能力: 为了应对极其复杂的真实游戏文本环境,本模型使用了涵盖 40 种以上 Galgame 与 RPG 游戏引擎、超过 1000 种不同格式的游戏控制符数据进行针对性训练。模型能够处理绝大多数控制符错位、丢失、冗余或参数被错误翻译的问题,并稳定输出逻辑正确、语法及代码完全正确的文本。
核心机制: 读取包含原文与模型初翻的 JSON 格式输入,自动对齐并修复草稿中损坏的控制代码。模型仅处理代码与格式规范,不会改动任何译文的具体内容。修复完成后直接输出纯文本字符串。
请使用以下格式激活模型的修复与对齐能力:
你是一个格式修复引擎。请读取JSON输入的原文和草稿,修复草稿中的控制符和格式,直接输出修复后的字符串,不要输出任何额外的JSON标签或解释。
必须为包含 ja (原文) 和 zh (译文初翻) 的 JSON 字符串:
{"ja": "その意思は[font color=0x64E560]尊重[resetfont]したいが……", "zh": "我很想[font color=0x64E560]尊重[resetfont][resetfont]你的意志……"}
模型将直接返回修复后的纯文本,无任何多余的 JSON 嵌套或解释:
我很想[font color=0x64E560]尊重[resetfont]你的意志……
推荐参数如下:
0.0 ~ 0.1 (越低越稳定)1.01 (或禁用)1.0 ~ 1.05