「コードを読んでいませんでした。 コードから把握します。 コード上は実際には違いました。 正しくはこうです。」これは、「一次情報を必ず確認して」とCLAUDE.mdに書いとくと、一切なくなるんだな
この人デフォルトのまま使ってる?
うちのClaude Codeはこの記事で言われているCodexのような振る舞いをする。特にそのような指示は入れてないんだけど、何が違うんだろ
それって個人の感想ですよね
前にXでClaude CodeとCodexの比較をしてた人がいたんだけど、その人も「Claude Codeはコミュ力が高いけどたまに空気を読みすぎる」「Codexは無愛想だけど仕事は堅実」みたいな結論だったな。
Codexはplanモードがあるので、そのモードに切り替えてからコード分析と実装したいことのAGENT.md作成&テストの作成をし、テストの中身を自分でチェック後、高性能モデルに切り替えて実装開始させた方が良いぞ?
何となくわかる気がする。まだ、初心者だけど。
もうここまでサービスとして組み込まれてしまっては、LLMの成り立ちから今の振る舞いを説明することは難しい。
使ってて思うのは相互レビューは有用で、大抵は何かしらの見落とし(しばしばクリティカルな論点もある)を発見してくれる。
筆者の使い分け「調査・技術検討・PR作成 → Claude Code 、実装・リファクタリング・コード修正 → Codex」
経験上、CLAUD.MDにせよ、AGENTS.MDにせよ、これらの憲法をしっかりかけるかが全て。あとはドキュメントとADRを適切に書かせて読ませる。ただ、トークン使用量は増える。
新モデルが出るとまた変わる部分もありますが、私が感じていたこととおおむね一致しててて安心しました。
調査・技術検討・PR作成 → Claude Code 実装・リファクタリング・コード修正 → Codex
Claude CodeとCodexを両方使ってみての感想、ポン出しではCodexのほうが見た目がダサい無骨なデザインを出してくる。言えば直るが、Claude Codeは言わなくてもオシャレっぽいのを出してくれるんだよな…
“coding agentは、実際のコードベースや実行結果へ接地(grounding)する方向へ進んでいる。Claude CodeはOpus 4.7 の体験が悪く(計画重視。「コードを読んでいませんでした」)、Codexはコード重視なので、実装はCodexに任せる”
自分がCodexの方が優秀と感じるのもこの辺が理由なのかもな。Claudeはなんか嘘というか不誠実なコードが混じりやすい。
低品質。せめてタイトル通りに書きましょう。
この使い分けが今後も続くとは限らない。最近の動向として、モデルの進化は非常に速く、今回観測した特性差そのものが数か月後には小さくなっている可能性 > ですね。
エージェントの比較なのにモデルすら固定しないなんて
人によってClaudeの評価が全然違うのはサーバー側はユーザーによってはKVキャッシュが壊れている説。あと、長時間の自律的な動作に舵を切ったトレーニングが裏目に出ている気もする。
Claude Codeはplanや文脈との整合性、Codexはコードや実行結果との整合性を重視する傾向。筆者は「調査・整理・PR作成はClaude、実装・修正・リファクタリングはCodex」と使い分け。片方で行き詰まる→もう片方→成功しやすい。
Claude Code と Codex を使い比べて見えた設計思想の違い
「コードを読んでいませんでした。 コードから把握します。 コード上は実際には違いました。 正しくはこうです。」これは、「一次情報を必ず確認して」とCLAUDE.mdに書いとくと、一切なくなるんだな
この人デフォルトのまま使ってる?
うちのClaude Codeはこの記事で言われているCodexのような振る舞いをする。特にそのような指示は入れてないんだけど、何が違うんだろ
それって個人の感想ですよね
前にXでClaude CodeとCodexの比較をしてた人がいたんだけど、その人も「Claude Codeはコミュ力が高いけどたまに空気を読みすぎる」「Codexは無愛想だけど仕事は堅実」みたいな結論だったな。
Codexはplanモードがあるので、そのモードに切り替えてからコード分析と実装したいことのAGENT.md作成&テストの作成をし、テストの中身を自分でチェック後、高性能モデルに切り替えて実装開始させた方が良いぞ?
何となくわかる気がする。まだ、初心者だけど。
もうここまでサービスとして組み込まれてしまっては、LLMの成り立ちから今の振る舞いを説明することは難しい。
使ってて思うのは相互レビューは有用で、大抵は何かしらの見落とし(しばしばクリティカルな論点もある)を発見してくれる。
筆者の使い分け「調査・技術検討・PR作成 → Claude Code 、実装・リファクタリング・コード修正 → Codex」
経験上、CLAUD.MDにせよ、AGENTS.MDにせよ、これらの憲法をしっかりかけるかが全て。あとはドキュメントとADRを適切に書かせて読ませる。ただ、トークン使用量は増える。
新モデルが出るとまた変わる部分もありますが、私が感じていたこととおおむね一致しててて安心しました。
調査・技術検討・PR作成 → Claude Code 実装・リファクタリング・コード修正 → Codex
Claude CodeとCodexを両方使ってみての感想、ポン出しではCodexのほうが見た目がダサい無骨なデザインを出してくる。言えば直るが、Claude Codeは言わなくてもオシャレっぽいのを出してくれるんだよな…
“coding agentは、実際のコードベースや実行結果へ接地(grounding)する方向へ進んでいる。Claude CodeはOpus 4.7 の体験が悪く(計画重視。「コードを読んでいませんでした」)、Codexはコード重視なので、実装はCodexに任せる”
自分がCodexの方が優秀と感じるのもこの辺が理由なのかもな。Claudeはなんか嘘というか不誠実なコードが混じりやすい。
低品質。せめてタイトル通りに書きましょう。
この使い分けが今後も続くとは限らない。最近の動向として、モデルの進化は非常に速く、今回観測した特性差そのものが数か月後には小さくなっている可能性 > ですね。
エージェントの比較なのにモデルすら固定しないなんて
人によってClaudeの評価が全然違うのはサーバー側はユーザーによってはKVキャッシュが壊れている説。あと、長時間の自律的な動作に舵を切ったトレーニングが裏目に出ている気もする。
Claude Codeはplanや文脈との整合性、Codexはコードや実行結果との整合性を重視する傾向。筆者は「調査・整理・PR作成はClaude、実装・修正・リファクタリングはCodex」と使い分け。片方で行き詰まる→もう片方→成功しやすい。