Claudeの長時間自律開発で、3-agent(planner/generator/evaluator)とPlaywright MCPで品質評価し4時間実装・QAする手法を解説する記事です。
マルチエージェントでの評価ループは熱いな。単発プロンプトの限界が見えてきた感ある
この開発スタイルをClaude Code単体で提供するようになるのだろうか。それにしても、どんどんお金がかかるようになってるな。
Harness design for long-running application development
Claudeの長時間自律開発で、3-agent(planner/generator/evaluator)とPlaywright MCPで品質評価し4時間実装・QAする手法を解説する記事です。
マルチエージェントでの評価ループは熱いな。単発プロンプトの限界が見えてきた感ある
この開発スタイルをClaude Code単体で提供するようになるのだろうか。それにしても、どんどんお金がかかるようになってるな。