はてなまとめ - Googleが「Gemma 4 12B」をリリース。ノートPCで動いて26B級の性能、またお化けローカルLLM

1: enemyoffreedom 2026/06/04 08:01

量子化モデルならVRAM8GBのGPUでギリ動くか、厳しいか

2: zsehnuy_cohriy 2026/06/04 08:22

丁度いいサイズ感

3: nguyen-oi 2026/06/04 08:39

VRAM16GBで動くのは夢があるな。ゲーミングノートの使い道がやっとマイニング以外に見つかりそう

4: stabucky 2026/06/04 08:39

新しいのが出る度に入れ替えているが、正直、頭が良くなっているのか、分からない。

5: Nunocky 2026/06/04 08:42

ollamaは pre release版(0.30.4)が必要っぽい。対応待ち / LM Studioで動かしてみました https://nunocky.hatenablog.com/entry/2026/06/04/101355 / ollamaも更新された模様

6: hidari_kiki 2026/06/04 09:16

claude codeとかcodexが従量課金になったらみんなこっちに流れてしまうのかな。そうならないためにも定額残しておいてほしいし、そのためにも頑張ってほしい

7: minoton 2026/06/04 09:19

RTX4070(12GB)にgemma-4-12B-it-Q6_K.ggufを載せて、SillyTarvernでつなげて評価？中。E4Bや他の8Bクラスとの比較では良い感じ／ Instantaleも先に進めたいのだが時間が……

8: iinalabkojocho 2026/06/04 09:21

我が家のM4Air32Gでも十分使えるようで助かる。複数台を繋いで役割分担が相応しいかも。

9: ykira 2026/06/04 09:22

LM StudioだとRuntime最新にしてもロードに失敗するな・・・

10: beeeyond 2026/06/04 09:27

16GBぐらいに乗るサイズ感はありがたい。どこかで試してみよ。

11: dozo 2026/06/04 09:31

unsloth最新版でロード成功。日本語がちょっと苦手のようだ

12: kamm 2026/06/04 09:31

「山口県について教えて」と質問するとそんな県は存在しないという回答を返すらしいhttps://nowokay.hatenablog.com/entry/2026/06/04/033047

13: toaruR 2026/06/04 09:33

LM Studio 自体をアップデートすれば LM Studio でも動いたよ（windows）コンテスト長20000で10.30G

14: raitu 2026/06/04 09:34

“何がすごいって、VRAM16GBで動作するとされていること。ノートPC向けに設計されています。”

15: t1mvverr 2026/06/04 09:39

スマホに搭載できないとインパクトあんまり無くないか。良いグラボが必要だから業務PCだと動かないし中途半端だと思う

16: gcyn 2026/06/04 09:52

（すぐに試せてる人が結構いるんだな〜。）

17: internetkun 2026/06/04 09:57

Gemma 4 E2Bが既にスマホでも実用的に動くので12Bをわざわざスマホでも動くようにする必要はないですね

18: rax_2 2026/06/04 09:57

このグラボ高騰時代にVRAM16Gで設計されてもさぁ…。

19: takuver4 2026/06/04 10:10

試さなければ…

20: tyhe 2026/06/04 10:14

VRAM16GBかあ。足りないなあ。

21: mobile_neko 2026/06/04 10:19

MacBookAir M4 16GBでちょっと怪しいけどちゃんと動いた。ノートPCのローカルでこの性能が出るのはすごいよなあ。

22: strawberryhunter 2026/06/04 10:19

Gemma 4 31Bが結構使えるモデルだった。Gemma 4 26B A4Bは試してないが31Bより下なので12Bはどんなもんだろう。->31Bの2倍速くらい。細かい検証はしてないけど会話は自然で31Bと区別が付かなかった。

23: kibitaki 2026/06/04 10:20

gizmodeがくっそ読みづらくなってる。

24: pendamadura 2026/06/04 10:46

E4Bはなんか名前が小さいから12B試したい

25: fusionstar 2026/06/04 10:53

12GB の 4070Ti で使ってみたら、まず速い。いつも試してる有名作品のあらすじを教えてもらうテストは、推論なしだと他のローカル LLM 同様に固有名詞が怪しいけど推論ありだとほぼ正しい内容が出た。

26: somaria3 2026/06/04 11:00

30B前後はかなり実用できるので期待　しかしollamaはあんま入れたくねえな...

27: cloverstudioceo 2026/06/04 11:12

結局opus4.7とかに慣れちゃってるからコーディングエージェントとして使う気には無れんのが問題よね。。。

28: sou0509 2026/06/04 11:44

ただただ時間が足りない。世界の時間を止めて俺に1年くれ。

29: ardarim 2026/06/04 11:50

「何がすごいって、VRAM16GBで動作するとされていること。ノートPC向けに設計されています。」ごめんなさい、貧乏人なのでVRAM16GBも持ってないです…低みの見物　GGUFならワンチャンかもだけどマトモに動く気がしない

30: otchy210 2026/06/04 11:55

最近のローカルモデル、回答の質の差があんま分からないのはそうなんだけど、さっそくこれを試してみたら、推論を無効にした時にかなり早く妥当な答えを返したので、スピードの面で良さそう。

31: hosiken 2026/06/04 11:58

WindowsのLM Studioでは lmstudio-community/gemma-4-12B-it-GGUF だといけたし Q4_K_M でも日本語良かった／google本家やunsloth版の出力が壊れていたのはバグらしく修正済／量子化されてるやつならVRAM 16GBもいりません、8GBあれば全部VRAMに入る

32: tuka8s 2026/06/04 12:15

“VRAM16GBで動作するとされていること。ノートPC向けに設計されています。”そんなノートPC高くて買えない、、、

33: hhungry 2026/06/04 12:24

使わないけど、GPT、Claudeにプレッシャーをかけてくれるのは歓迎

34: ywdcn 2026/06/04 12:27

ollamaで導入しようと思ったらエラーが出てしまった。アプデされてるのかな？もう一回やってみるか。16gのGPUなのでいい感じで動くといいが。

35: srng 2026/06/04 12:30

ミドルクラスのゲーミングPCでも動くちょうどいいサイズ。16GBでも画面出力別にしなくていい程度には余裕ありそう

36: bike-a-to-z 2026/06/04 12:47

3060tiだと厳しいよな。だれか試したやついないかな。グラボ費用回収できるならローカルで本番適用したいなぁ

37: aox 2026/06/04 13:12

6Bでもクレヨンみたいなのに、12Bなんてもはや粉では

38: otoan52 2026/06/04 13:13

MacのMLXで使ってると26B-A4Bが優秀なんだよな。VRAMの制限がないので（メインメモリをつかうから）アクティブが4Bなのが素直に効いてる。

39: dalmacija 2026/06/04 13:28

一般人、ローカル動作を量子化モデルで使わない人はいないだろ

40: fusanosuke_n 2026/06/04 13:32

ヨシ、弊社の次回PC更新では皆5070Ti搭載マシンにするぞ！　とはならないよな

41: prjpn 2026/06/04 13:40

凄いんだけど、欲しいのはGeminiの劣化版じゃなくてClaudeみたいな謙虚なLLMなんだよね。

42: jintrick 2026/06/04 13:49

"「無料Claude Code」的なこともできる、かなり推論性能が高いモデルです。" 無理だって

43: um-k3 2026/06/04 14:36

どんどん競争してどんどん安くて良いものになってくれ…

44: tdam 2026/06/04 14:50

RadeonとArcは使えますか？

45: oktnzm 2026/06/04 15:22

いいんだけど、gemma4 種類が多すぎて困る。

46: Kmusiclife 2026/06/04 15:29

そろそろこの時代に。

47: star_123 2026/06/04 15:36

“Gemma 4 12B”　VRAM16GB民としては10～20B間で最新モデルが欲しかったのでこれはありがたい、実用するとなると量子化してもVRAM満タントークンカツカツは困る。

48: bayaread 2026/06/04 15:52

ローカルでちょっとしたエージェントにするのはいいけど、少しでも複雑なタスクだと解けないからね。仕事で使うなら課金してフロンティアモデル使うべきだよ。

49: racooon 2026/06/04 16:37

3060 12GB自作PCでやってみよ。26Bは遅かったけどこれはどうかな。

50: augsUK 2026/06/04 18:10

低いリソースで動くのももちろん大事だけど、ローカルLLMでも純粋に高性能というものが欲しい。copilotもトークン従量制になってAPI利用は2025年が華だったとなりそうなので。

51: misshiki 2026/06/04 18:42

GoogleがGemma 4 12Bを発表。Gemma 4 26B A4Bに迫るベンチマークで、VRAM16GB動作・ノートPC向け設計。音声をエンコーダなしで処理し、遅延やメモリ使用量を低減。

52: magi00 2026/06/04 19:58

まぁ、どこもクラウドLLMのトークン削減の手段としてローカルLLMを利用したいみたいだからクラウドに勝てなくてもいいのよ。

53: ndanna 2026/06/04 20:22

後で見る

54: lost_and_found 2026/06/04 21:37

日本語がかなり怪しいらしい

55: bomem 2026/06/04 23:20

denseの12BとMOEの26Bが同程度の性能なのって驚くような話か？

Googleが「Gemma 4 12B」をリリース。ノートPCで動いて26B級の性能、またお化けローカルLLM | ギズモード・ジャパン