“出力された原稿にピンポイントでコメントを入れ、対話しながら磨き上げていく、Antigravity独特の素晴らしいUI機能を使いたい。Qwen2.5:7bでPC内の数万文字のファイルをローカルで全量読書し、数百文字に濃縮する”
よさげ。AI自体の対話コストも無視はできないが、トークン消費する雑用的なものを外注できれば強そう。ただどうしてもクラウドより時間かかるから待てる仕事に限られるだろうが。
将来的には主従のどちらかをローカルLLMが担当するのが主流になっていくんだろうけど、まだローカルLLMが重いんだよなぁ...
ローカルに要約させてクラウドに投げるハイブリッド構成はクオータ節約に賢いな
完全無料とは案件
クオータを削減するのは悪手では、クオータ制限の対象となる利用量を削減するのは意味あるけれど
ローカルLLMバリバリ使ってるとYoutube(やゲームやDTMやさらに別の開発)の片手間に開発、とかが出来ないので!
agyでgemini-3.5-flash使ってコードレビューさせてみるとLowでも予想以上に精度が良かったんだけど、クォータ枯渇が早いのが悩みどころだったので試してみたいかも。
それアングラいらんくね?
これ頑張っても local llm の成果物の正しさを呼び出し元のモデルが検証しないといけないから、あんま節約にはならんと claude が言ってたな。元々 WebFetch とかは Opus が Haiku 呼び出したりするので使いようなのかな。
AntigravityとローカルLLMをMCPで繋ぐ!完全無料でクオータを99%削減する連携術
“出力された原稿にピンポイントでコメントを入れ、対話しながら磨き上げていく、Antigravity独特の素晴らしいUI機能を使いたい。Qwen2.5:7bでPC内の数万文字のファイルをローカルで全量読書し、数百文字に濃縮する”
よさげ。AI自体の対話コストも無視はできないが、トークン消費する雑用的なものを外注できれば強そう。ただどうしてもクラウドより時間かかるから待てる仕事に限られるだろうが。
将来的には主従のどちらかをローカルLLMが担当するのが主流になっていくんだろうけど、まだローカルLLMが重いんだよなぁ...
ローカルに要約させてクラウドに投げるハイブリッド構成はクオータ節約に賢いな
完全無料とは案件
クオータを削減するのは悪手では、クオータ制限の対象となる利用量を削減するのは意味あるけれど
ローカルLLMバリバリ使ってるとYoutube(やゲームやDTMやさらに別の開発)の片手間に開発、とかが出来ないので!
agyでgemini-3.5-flash使ってコードレビューさせてみるとLowでも予想以上に精度が良かったんだけど、クォータ枯渇が早いのが悩みどころだったので試してみたいかも。
それアングラいらんくね?
これ頑張っても local llm の成果物の正しさを呼び出し元のモデルが検証しないといけないから、あんま節約にはならんと claude が言ってたな。元々 WebFetch とかは Opus が Haiku 呼び出したりするので使いようなのかな。