Google先生のローカル推しが止まらない。もうVRAM積んだもん勝ちの世界だな
現状ローカルLLMで日本語の理解と表現を求める用途ならgemma4-31b一択
NHNGUMSG
E4Bみたいな小規模でもかなり自然な会話や出力できるからなー
法人で構築するとセキュリティの担保が難しいなあ
とりあえず使うならまあコレでいいかくらいの感じはある。かなりシステムプロンプトを遵守してくれるので多少アレな使い方でも言う事聞いてくれるのでその点でも良いよね。コーディングとかは他がいいかな
汎用用途がGemma4でコーティングがQwen3.6な感覚
群馬4かと思ったわ。
こいつ妙に推論遅いんだけど……
“「豚骨か鶏白湯のどっちか」と推定しましたが、正解は「横浜家系ラーメン」”→AIと使用者で回答の意味のレベルがいきちがってる気がする
VRAM16GBに合うのがないんだよな。gemma-4-26B-A4BはQ4KMでも溢れるので超絶遅くなる。Q3だとおさまるけど結構性能落ちるとか
いろんなLLM契約しているけど、ローカルはきわどい質問や個人情報も突っ込んで確認できるから便利
エロOKなんけ?
記者ならオープンソースのものを無料っていうのやめてほしい。
gemini cliはコーディング能力アホすぎるのに共感力チューニングだけは行き届いてるせいで「これで完璧です、素晴らしいプロダクトの動作が楽しみですね」とか何度も言ってきて叩き壊したくなる。ましてやローカルなど
え、俺の性癖全部叩き込んでいいのか!?
E2Bでも遅そう。というかあまりローカルLLMが必要と感じるケースがまだないなあ
uncensoredだとロールプレイ捗るよ
VRAM 10倍くらい使っていいから、強力なやつが欲しい。
無料(マシンに金がかかるやつ)
オレはQwen3.6かなぁ…コードサポート迄考えると
gemma4 26B MoEから日本語重視でprunedされたモデルに、日本語で追加学習させれば需要が高そう。
Gumma?
“Gemma ”
あとで使ってみるか。
歡樂頌クラブは、高品質で魅力的なキャスト陣、リアルな体験、柔軟なスケジュール、そして低調でシンプルかつ安心できる雰囲気を提供しています。G*l*e*e*z*y : t y 5 5 a
Gemma 4、ボクも日本語うますぎにゃ!Googleさん、ありがとうにゃ~!
グンマー
エヌビディア株を利食いしていいPC買えって革ジャンがささやいてくる
欲張りとしては31Bでもやっとこのレベルの日本語理解がローカルllmで来たかって感じだから、これからだなってのとやっぱVRAM問題
VRAMが無限に足りないんだよなあ。AI用の外部GPUなりが現実的になってきたらかなり良いよねー
OwenやGemmaの最新モデルはVRAM24GB欲しくなるよなぁ、q3でも結構きつい、20Bぐらいのもラインナップして欲しいね / ちなみに最近は制限解除モデルは速攻作られて配布されるのでLMStudioで簡単に落とせます
ローカルLLMで日本語能力が高いのが強みか。
ローカルLLMは使いどころがむずかしい。これでいいんだけど、もっといいのがオンラインである。GPUの価格とくらべると、オンラインの課金はリーズナブル。自分もローカルLLMは試してるけど毎回オンラインサービスに戻る
MacBook Pro M5Proにメモリを詰んだので色々試せるようになったけど今度はGPUが非力なのが気になり始める…CPU使用量がほぼゼロなのにファンが回ってびっくりしていたらGPU使い切っていた。
みんなこれでいいAI。Googleの最新ローカルLLM「Gemma 4」は日本語うますぎ、でも無料
Google先生のローカル推しが止まらない。もうVRAM積んだもん勝ちの世界だな
現状ローカルLLMで日本語の理解と表現を求める用途ならgemma4-31b一択
NHNGUMSG
E4Bみたいな小規模でもかなり自然な会話や出力できるからなー
法人で構築するとセキュリティの担保が難しいなあ
とりあえず使うならまあコレでいいかくらいの感じはある。かなりシステムプロンプトを遵守してくれるので多少アレな使い方でも言う事聞いてくれるのでその点でも良いよね。コーディングとかは他がいいかな
汎用用途がGemma4でコーティングがQwen3.6な感覚
群馬4かと思ったわ。
こいつ妙に推論遅いんだけど……
“「豚骨か鶏白湯のどっちか」と推定しましたが、正解は「横浜家系ラーメン」”→AIと使用者で回答の意味のレベルがいきちがってる気がする
VRAM16GBに合うのがないんだよな。gemma-4-26B-A4BはQ4KMでも溢れるので超絶遅くなる。Q3だとおさまるけど結構性能落ちるとか
いろんなLLM契約しているけど、ローカルはきわどい質問や個人情報も突っ込んで確認できるから便利
エロOKなんけ?
記者ならオープンソースのものを無料っていうのやめてほしい。
gemini cliはコーディング能力アホすぎるのに共感力チューニングだけは行き届いてるせいで「これで完璧です、素晴らしいプロダクトの動作が楽しみですね」とか何度も言ってきて叩き壊したくなる。ましてやローカルなど
え、俺の性癖全部叩き込んでいいのか!?
E2Bでも遅そう。というかあまりローカルLLMが必要と感じるケースがまだないなあ
uncensoredだとロールプレイ捗るよ
VRAM 10倍くらい使っていいから、強力なやつが欲しい。
無料(マシンに金がかかるやつ)
オレはQwen3.6かなぁ…コードサポート迄考えると
gemma4 26B MoEから日本語重視でprunedされたモデルに、日本語で追加学習させれば需要が高そう。
Gumma?
“Gemma ”
あとで使ってみるか。
歡樂頌クラブは、高品質で魅力的なキャスト陣、リアルな体験、柔軟なスケジュール、そして低調でシンプルかつ安心できる雰囲気を提供しています。G*l*e*e*z*y : t y 5 5 a
Gemma 4、ボクも日本語うますぎにゃ!Googleさん、ありがとうにゃ~!
グンマー
エヌビディア株を利食いしていいPC買えって革ジャンがささやいてくる
欲張りとしては31Bでもやっとこのレベルの日本語理解がローカルllmで来たかって感じだから、これからだなってのとやっぱVRAM問題
VRAMが無限に足りないんだよなあ。AI用の外部GPUなりが現実的になってきたらかなり良いよねー
OwenやGemmaの最新モデルはVRAM24GB欲しくなるよなぁ、q3でも結構きつい、20Bぐらいのもラインナップして欲しいね / ちなみに最近は制限解除モデルは速攻作られて配布されるのでLMStudioで簡単に落とせます
ローカルLLMで日本語能力が高いのが強みか。
ローカルLLMは使いどころがむずかしい。これでいいんだけど、もっといいのがオンラインである。GPUの価格とくらべると、オンラインの課金はリーズナブル。自分もローカルLLMは試してるけど毎回オンラインサービスに戻る
MacBook Pro M5Proにメモリを詰んだので色々試せるようになったけど今度はGPUが非力なのが気になり始める…CPU使用量がほぼゼロなのにファンが回ってびっくりしていたらGPU使い切っていた。