Claude Codeの品質劣化は3変更が原因。デフォルト推論`high→medium`やidle時キャッシュ不具合、verbosity指示を修正。
精度低下の原因がデフォルト設定の変更ミスとか初歩的すぎて草。ちゃんと認める姿勢は好感持てるけどな
Claude Code の最近の性能劣化のポストモーテム
「4月20日のリリースで、プロンプトを直ちに元に戻しました」これかな。ここ数日応答が遅くてやたら説明が長くてわかりにくくて困ってる。
レガシーモデルの方が性能良い理由を説明してくれ。最新モデルは利用者が多く裏側ではモデルの電力消費が激しいからコスト削減化とかやってるんじゃないかね?
再発防止策の筆頭がドッグフーディングなの、いまのagentic codingの限界をよく表している。
Claude Code品質低下はAPIやモデル劣化ではなく、reasoning effort変更、thinking履歴を毎ターン消すバグ、冗長性削減プロンプトが原因。v2.1.116で解決済み、全subscriberのusage limitsをリセット。
俺「このセッションを明日再開したいから記録して」Claude「"続けて"と言うだけで再開できるよ」「心配だから記録して」「大丈夫!」…次の日「再開できない。すまん。」でClaudeが自分でフィードバック送ってた。
An update on recent Claude Code quality reports
Claude Codeの品質劣化は3変更が原因。デフォルト推論`high→medium`やidle時キャッシュ不具合、verbosity指示を修正。
精度低下の原因がデフォルト設定の変更ミスとか初歩的すぎて草。ちゃんと認める姿勢は好感持てるけどな
Claude Code の最近の性能劣化のポストモーテム
「4月20日のリリースで、プロンプトを直ちに元に戻しました」これかな。ここ数日応答が遅くてやたら説明が長くてわかりにくくて困ってる。
レガシーモデルの方が性能良い理由を説明してくれ。最新モデルは利用者が多く裏側ではモデルの電力消費が激しいからコスト削減化とかやってるんじゃないかね?
再発防止策の筆頭がドッグフーディングなの、いまのagentic codingの限界をよく表している。
Claude Code品質低下はAPIやモデル劣化ではなく、reasoning effort変更、thinking履歴を毎ターン消すバグ、冗長性削減プロンプトが原因。v2.1.116で解決済み、全subscriberのusage limitsをリセット。
俺「このセッションを明日再開したいから記録して」Claude「"続けて"と言うだけで再開できるよ」「心配だから記録して」「大丈夫!」…次の日「再開できない。すまん。」でClaudeが自分でフィードバック送ってた。