テクノロジー

GPT-5とClaude Sonnet 4でコーディング比較。ChatGPTはツールとして使い物にならない - きしだのHatena

1: nekoline 2025/08/12 00:53

“挙動には関係ないけど、コンパイルエラーのことを「Javaが怒っています」と言ってますね。こういうスラングが取り込まれてるのはちょっとおもしろい。”

2: winter123412 2025/08/12 05:09

少し触った感じだとGPT5のほうがコーディング優れてるかなー 適当なプロンプトでもエラー原因とかの特定精度高い APIでしかコーディングしないから使いものならないというのがよくわからんけどw

3: ducky19999 2025/08/12 06:53

なぜswingなのか

4: jintrick 2025/08/12 07:51

これは怖い。でもGPT-5というよりはChatGPTのお話だったので判断保留。"バグ修正したときに関係ないところも変わってるというのもよくあった。メソッド内に3つあった処理が1つになって消えてる、とか。信用できない"

5: TakamoriTarou 2025/08/12 07:55

頭はよくなってるけど、人間が望む挙動を厳格に再現する部分が落ちてるっぽい、と言う感じは自分も感じてる。コーディング以外でも、文章を適宜改行入れてみたいな軽いタスクで勝手に箇条書きにしたりとか

6: fog-og-frog2 2025/08/12 08:08

比較対象がどちらもFreeプランで動かせるモデルで、時間かけたわりには安上がりの検証だなって思った。ケチくさいエンジニアが使うならClaudeで、か?300+200で500$払って頂上決戦してくれ。Opus 4の方がもっと賢いから

7: sotonohitokun 2025/08/12 08:17

趣味ですら課金すれば良いのにとおもわなくもない。

8: T-norf 2025/08/12 08:27

本論はスルー。末尾 ChatGPT free の 8k制限もきついけど、ChatGPT Plus / Team も 32k で、多分 o3 とかに比べると減なのね。モデルの紹介では long context を売りしたようなグラフも出してたのにな。GitHub copilot経由だとどうなんだろ

9: dec123456789 2025/08/12 09:24

無料版かよ。10回で制限くるのにそれでプログラミングするやついるんか?Claudeにいたっては無料だと5回で制限。どちらも推論は制限されてるし。こんな雑に使う人が出版社でAIの連載してるとは⋯。

10: anonie 2025/08/12 09:26

makefileの複雑な処理をシンプルな形に展開する作業をopusだと無理でGPT-5 thinkingはあっさり解いてくれるのに、分散システムのconsistencyとdurabilityを混同して訂正しても直らなかったりするしピンポイントで使うツール何だと思

11: auto_chan 2025/08/12 09:31

開発環境やリポジトリへの統合がすすんでそろそろ「Chatでコーディングしてる人って……」って後ろ指さされそう。ともあれSonnetも3.7, 4の愛好家がそれぞれいるように絶妙なチューニングに振り回されるのしんどいね

12: inazuma2073 2025/08/12 09:44

無料のままじゃコーディングなんかできねえ!って有料に切り替えたクチなんだけど、どういう感想を持てばいいのか解らなかった。

13: hosiken 2025/08/12 09:45

Canvasにコードを書かせたとき書いた詐欺するのはo3からあった。コードを部分的に壊すこともあった。GPT-5はカードに限らず、中途半端な返答をして「完全版もできますが、やりますか?」で最初からやれよパターン多すぎる

14: hiroshima_pot 2025/08/12 10:29

この書き手はただのゴミ釣り師だけど、キャンバスの扱いの信頼性が低いのは本当。

15: hiroshe 2025/08/12 10:32

ワイヤフレームってウェブの画面設計で使うやつかと思った