Anthropicがskill-creatorを強化。評価、ベンチマーク、A/B比較、並列評価、トリガー精度改善を追加し、コード不要でAgent Skillsの品質検証が可能に。将来の仕様駆動開発を見据えた基盤とも位置付ける。
AIエージェントの「スキル」の品質低下を防ぐ? テストと検証機能を強化
Anthropicがskill-creatorを強化。評価、ベンチマーク、A/B比較、並列評価、トリガー精度改善を追加し、コード不要でAgent Skillsの品質検証が可能に。将来の仕様駆動開発を見据えた基盤とも位置付ける。