基于Ouroboros的实时在线式框架所用模型。 该模型已经预置sos和eos
其中推理配置为
system : [65530, 65531] request :[65530,65532] response:[65530, 65534]
eos统一为 [65535]