はてなまとめ - 数兆パラメータの時代に、無料GPU環境で3Bモデルを動かしたら想像以上だった

1: nguyen-oi 2026/02/22 20:52

3BでQwenの32B超えとか胸熱。日本語の怪しさはあるけど、ローカルでこれだけ動けば十分捗るな

2: kotesaki 2026/02/22 23:34

gguf版のQ4_K_M試したけどなんかぐるぐるThinkngを繰り返している感じ。使いどこをちゃんと幹わけないとだめっぽい。

3: osakana110 2026/02/23 00:11

ちょろっと使ってみたけど、だいたい、20秒から50秒考えて回答する感じやな。

4: uzusayuu 2026/02/23 01:34

計画とマネージメントはclaude、コーディングとテストはローカル、みたいな使い分けできんかなあ