Text Generation
Transformers
Safetensors
qwen3
conversational
text-generation-inference

用于科学和推理挺好,但是用于代码生成的话,推理链条过长,上下文一长,有些地方就忘记了

#3
by bizhonggeng - opened

用于科学和推理挺好,但是用于代码生成的话,推理链条过长,上下文一长,有些地方就忘记了
现在最好用的Claude系列,token都很短
开源的gpt-oss系列,token也很短
这个模型要用在代码生成上,还是需要考虑如何处理下长推理。

Sign up or log in to comment