うーん、仕事じゃないので16Gビデオカード買うか迷うレベル。50系は様子見と思ってるけどかなりそそられる/120B動くミニパソが25万、かなりそそられる。https://www.bosgamepc.com/
AWSのベッドロックでも使えるよ
まじかよ。24GBあればコーディング実用ちゃうの「RTX4060 Ti 16GBで動かしました。71token/sec!速い!」「17000トークンまでならVRAMに載りそう」そしてJavaのコーディングうるさがたが「かなりコーディング能力も高そうです」
おー、ようやくコーディングエージェント試してる人が居た!と思ったら20bか。120bでもQwen3 CoderやGLM4.5 Air などに負けてる様子だけど、はたして、どうなんだろうか?
“120Bは80GBのVRAM、20Bは16GBのVRAMで動きます。Qwen3 30Bを2bit量子化で動かせば80token/sec、賢さはかなり犠牲に。しかしGPT-oss 20Bは71token/secで賢い。使わない理由はない。口調がChatGPTだ。”
OpenAIのオープンモデルGPT-oss 20Bがすごすぎる - きしだのHatena
うーん、仕事じゃないので16Gビデオカード買うか迷うレベル。50系は様子見と思ってるけどかなりそそられる/120B動くミニパソが25万、かなりそそられる。https://www.bosgamepc.com/
AWSのベッドロックでも使えるよ
まじかよ。24GBあればコーディング実用ちゃうの「RTX4060 Ti 16GBで動かしました。71token/sec!速い!」「17000トークンまでならVRAMに載りそう」そしてJavaのコーディングうるさがたが「かなりコーディング能力も高そうです」
おー、ようやくコーディングエージェント試してる人が居た!と思ったら20bか。120bでもQwen3 CoderやGLM4.5 Air などに負けてる様子だけど、はたして、どうなんだろうか?
“120Bは80GBのVRAM、20Bは16GBのVRAMで動きます。Qwen3 30Bを2bit量子化で動かせば80token/sec、賢さはかなり犠牲に。しかしGPT-oss 20Bは71token/secで賢い。使わない理由はない。口調がChatGPTだ。”