用于科学和推理挺好,但是用于代码生成的话,推理链条过长,上下文一长,有些地方就忘记了
#3
by
bizhonggeng - opened
用于科学和推理挺好,但是用于代码生成的话,推理链条过长,上下文一长,有些地方就忘记了
现在最好用的Claude系列,token都很短
开源的gpt-oss系列,token也很短
这个模型要用在代码生成上,还是需要考虑如何处理下长推理。
用于科学和推理挺好,但是用于代码生成的话,推理链条过长,上下文一长,有些地方就忘记了
现在最好用的Claude系列,token都很短
开源的gpt-oss系列,token也很短
这个模型要用在代码生成上,还是需要考虑如何处理下长推理。