思考プロセス飛ばして爆速化とか実用性重視で草。精度犠牲にするのは勇気いるわ
“reasoning”がGPT-OSSのキモやろって思ったのだが、本文を見てもその考えが変わらなかった。
いやまあ、速きゃいいってんならそうだけど
reasoningなしは結構辛い気がする。Qwen3.5の小さいのもかなり支離滅裂になった。
これ、他のモデルにも転用できたりしないかなぁ~
gpt-ossの推論を6倍速に。Thinking OFF設定と、Ollamaで効かない理由 - Qiita
思考プロセス飛ばして爆速化とか実用性重視で草。精度犠牲にするのは勇気いるわ
“reasoning”がGPT-OSSのキモやろって思ったのだが、本文を見てもその考えが変わらなかった。
いやまあ、速きゃいいってんならそうだけど
reasoningなしは結構辛い気がする。Qwen3.5の小さいのもかなり支離滅裂になった。
これ、他のモデルにも転用できたりしないかなぁ~