汉字编码格式问题
#6
by
luohuashijieyoufengjun
- opened
记不太清楚了,你可以查查 HF 的文档或者在 repo 里面找找,应该有相关代码
记不太清楚了,你可以查查 HF 的文档或者在 repo 里面找找,应该有相关代码
我在tokenizer.json文件中看到了id和token的对应关系。但是从你github上的代码中没有看到这种对应关系的来源,你似乎没有在github上上传tokenizer文件夹
记不太清楚了,你可以查查 HF 的文档或者在 repo 里面找找,应该有相关代码
我在tokenizer.json文件中看到了id和token的对应关系。但是从你github上的代码中没有看到这种对应关系的来源,你似乎没有在github上上传tokenizer文件夹
是由一个 transformer 实现的标准方法来执行转换的,但是我不记不太清楚是哪个方法了,看看 transformer 文档或者问问 AI 看看
