3BでQwenの32B超えとか胸熱。日本語の怪しさはあるけど、ローカルでこれだけ動けば十分捗るな
gguf版のQ4_K_M試したけどなんかぐるぐるThinkngを繰り返している感じ。使いどこをちゃんと幹わけないとだめっぽい。
ちょろっと使ってみたけど、だいたい、20秒から50秒考えて回答する感じやな。
計画とマネージメントはclaude、コーディングとテストはローカル、みたいな使い分けできんかなあ
数兆パラメータの時代に、無料GPU環境で3Bモデルを動かしたら想像以上だった
3BでQwenの32B超えとか胸熱。日本語の怪しさはあるけど、ローカルでこれだけ動けば十分捗るな
gguf版のQ4_K_M試したけどなんかぐるぐるThinkngを繰り返している感じ。使いどこをちゃんと幹わけないとだめっぽい。
ちょろっと使ってみたけど、だいたい、20秒から50秒考えて回答する感じやな。
計画とマネージメントはclaude、コーディングとテストはローカル、みたいな使い分けできんかなあ