Чудо
Вы проделали очень достойную работу !
у меня LM Studio и контролировать мышление как с оригинальной моделью по кнопке не получится.
но если вставить строчку
{%- set reasoning_effort = "auto" %}
в системный промт, то она будет рассуждать очень долго детально, дольше чем если указать high вместо auto
у меня такой опыт по крайней мере
на удивление отвечает на краткие вопросы по существу, он действительно не открывает блок мыслей а сразу отвечает если использовать параметр none
Без мышления
С Авто мышлением
на моей памяти только версия JINX аблитерированная могла думать по русски причём они не трогали языки и не дообучали её, странно.
но ваш вариант лучше, лоботомия модели так или иначе влияет на точность и грамматику.
UPD хочу ещё добавить что он таки может рассуждать и на других языках европейских, в том числе и на восточных если вдруг кому будет интересно.
Фарси:
Турецкий



