レビューありがたい。/Qwen3-Coder 480BとQwen-2.5-Coderも入れて比較してみたいところ。
“ベンチマーク(コンテキスト短い)では評判だが、実際に使うと全然性能が高くない。コンテキスト長いと性能劣化が激しいのでは。30Bだと6000トークン、235Bだと15000トークンを超えるあたりから怪しく”
ああ、なるほど。MOEでアクティブパラメータ減らして知識量は大きいけど軽い!にも良し悪しあり。ならシングルエキスパートで多少でかいほうが逆に安定感があると。これ、初期のGPT4に感じた印象と同じかも
ネガティブな意見も。ただ、Coderは、「手元のマシンでLM StudioでQ4_K_M量子化」の30Bかな。逆にそれでコーディングできるのがすごい気もするが
14Bなら普通のゲーミングPC(VRAM12GB)くらいで動く
swing
ローカルでgemini flashレベルはまだ1〜2年は無理そうだね。
Vibeコーディングならqwen3-coderで再評価しないといけない。コンテクスト長も256kに、なってる。
なんとなくそんな気はしてたのでレビューありがたい。
「Overloadを消す」みたいなアホみたいなビルドフィックス、自分はDevinでもClaudeでも体験したことあるので、Qwen3だけがgdgdなのかはこれだけ見ても判然としない(ただ無限に直せないほどひどくはなかった)
オープンなモデルで本当にベンチマーク通りの性能出てると感じるのってDeepSeekだけじゃね?まあクローズドなモデルでもGeminiなんかはベンチマークほどの性能は感じないけど。
Qwen3:14BはRTX3060(12GB)でも実用的な速度で動くのでかなり使えるね。ありがたや。
Qwen3-235BやQwen3-30B、Qwen3 Coder Flashは長コンテキストでの性能劣化が激しいのでは - きしだのHatena
レビューありがたい。/Qwen3-Coder 480BとQwen-2.5-Coderも入れて比較してみたいところ。
“ベンチマーク(コンテキスト短い)では評判だが、実際に使うと全然性能が高くない。コンテキスト長いと性能劣化が激しいのでは。30Bだと6000トークン、235Bだと15000トークンを超えるあたりから怪しく”
ああ、なるほど。MOEでアクティブパラメータ減らして知識量は大きいけど軽い!にも良し悪しあり。ならシングルエキスパートで多少でかいほうが逆に安定感があると。これ、初期のGPT4に感じた印象と同じかも
ネガティブな意見も。ただ、Coderは、「手元のマシンでLM StudioでQ4_K_M量子化」の30Bかな。逆にそれでコーディングできるのがすごい気もするが
14Bなら普通のゲーミングPC(VRAM12GB)くらいで動く
swing
ローカルでgemini flashレベルはまだ1〜2年は無理そうだね。
Vibeコーディングならqwen3-coderで再評価しないといけない。コンテクスト長も256kに、なってる。
なんとなくそんな気はしてたのでレビューありがたい。
「Overloadを消す」みたいなアホみたいなビルドフィックス、自分はDevinでもClaudeでも体験したことあるので、Qwen3だけがgdgdなのかはこれだけ見ても判然としない(ただ無限に直せないほどひどくはなかった)
オープンなモデルで本当にベンチマーク通りの性能出てると感じるのってDeepSeekだけじゃね?まあクローズドなモデルでもGeminiなんかはベンチマークほどの性能は感じないけど。
Qwen3:14BはRTX3060(12GB)でも実用的な速度で動くのでかなり使えるね。ありがたや。