はてなまとめ - Qwen3-235BやQwen3-30B、Qwen3 Coder Flashは長コンテキストでの性能劣化が激しいのでは

1: strawberryhunter 2025/08/03 13:14

レビューありがたい。／Qwen3-Coder 480BとQwen-2.5-Coderも入れて比較してみたいところ。

2: yarumato 2025/08/03 14:46

“ベンチマーク（コンテキスト短い）では評判だが、実際に使うと全然性能が高くない。コンテキスト長いと性能劣化が激しいのでは。30Bだと6000トークン、235Bだと15000トークンを超えるあたりから怪しく”

3: shinobue679fbea 2025/08/03 15:11

ああ、なるほど。MOEでアクティブパラメータ減らして知識量は大きいけど軽い！にも良し悪しあり。ならシングルエキスパートで多少でかいほうが逆に安定感があると。これ、初期のGPT4に感じた印象と同じかも

4: T-norf 2025/08/03 15:28

ネガティブな意見も。ただ、Coderは、「手元のマシンでLM StudioでQ4_K_M量子化」の30Bかな。逆にそれでコーディングできるのがすごい気もするが

5: exciteB 2025/08/03 15:41

14Bなら普通のゲーミングPC（VRAM12GB）くらいで動く

6: bfoj 2025/08/03 16:16

swing

7: kei_1010 2025/08/03 17:01

ローカルでgemini flashレベルはまだ1〜2年は無理そうだね。

8: zgmf-x20a 2025/08/03 17:31

Vibeコーディングならqwen3-coderで再評価しないといけない。コンテクスト長も256kに、なってる。

9: diveintounlimit 2025/08/03 19:29

なんとなくそんな気はしてたのでレビューありがたい。

10: atsushieno 2025/08/03 20:04

「Overloadを消す」みたいなアホみたいなビルドフィックス、自分はDevinでもClaudeでも体験したことあるので、Qwen3だけがgdgdなのかはこれだけ見ても判然としない（ただ無限に直せないほどひどくはなかった）

11: dec123456789 2025/08/03 20:05

オープンなモデルで本当にベンチマーク通りの性能出てると感じるのってDeepSeekだけじゃね？まあクローズドなモデルでもGeminiなんかはベンチマークほどの性能は感じないけど。

12: ttrr 2025/08/03 20:17

Qwen3:14BはRTX3060（12GB）でも実用的な速度で動くのでかなり使えるね。ありがたや。

Qwen3-235BやQwen3-30B、Qwen3 Coder Flashは長コンテキストでの性能劣化が激しいのでは - きしだのHatena