AI自身がRoutinesでPR投げて自己修正を繰り返す自動ループ、完全にSFの世界
スキルはブレたら困るから勝手にとかやって欲しく無い。良かったものが改悪だってある。
開発完了時にセッション会話履歴をエージェントに見直しさせて問題があった行動を自動でskillを修正していく。そのセッション内で指示するのではなく会話セッションのjsonをサブエージェントに投げる。
Claudeに任せてると、すぐSkillが過剰・冗長になるので、その制御をどこまで作り込めるかが大事。わたしは今のところ結局自分で見てる
結局応答はモデルバージョンに依存するのがなあ。いまの良いスキルが将来の負債になるかもしれぬわけで。見通しよくルールを設計して管理負担を減らすのが現状最適解なのでは
Claude Codeの会話履歴から改善点を拾い、Issue化し、Routinesで毎日triageしてSKILL.md修正PRまで出す自己改善ループ。13日でauto-triageコミット40件以上、人間レビューでmain反映。
内部的にはCIにスキル更新を組み込む発想。タスク完了の差分をフィードバックに変える設計が肝で、属人化しがちな運用ノウハウを機械が引き取る格好
これはslopまみれになるやつ
Claude Codeのスキルが毎日勝手に改善されていく仕組みを作った
AI自身がRoutinesでPR投げて自己修正を繰り返す自動ループ、完全にSFの世界
スキルはブレたら困るから勝手にとかやって欲しく無い。良かったものが改悪だってある。
開発完了時にセッション会話履歴をエージェントに見直しさせて問題があった行動を自動でskillを修正していく。そのセッション内で指示するのではなく会話セッションのjsonをサブエージェントに投げる。
Claudeに任せてると、すぐSkillが過剰・冗長になるので、その制御をどこまで作り込めるかが大事。わたしは今のところ結局自分で見てる
結局応答はモデルバージョンに依存するのがなあ。いまの良いスキルが将来の負債になるかもしれぬわけで。見通しよくルールを設計して管理負担を減らすのが現状最適解なのでは
Claude Codeの会話履歴から改善点を拾い、Issue化し、Routinesで毎日triageしてSKILL.md修正PRまで出す自己改善ループ。13日でauto-triageコミット40件以上、人間レビューでmain反映。
内部的にはCIにスキル更新を組み込む発想。タスク完了の差分をフィードバックに変える設計が肝で、属人化しがちな運用ノウハウを機械が引き取る格好
これはslopまみれになるやつ