テクノロジー

GPT-5 まとめ

1: shinobue679fbea 2025/08/08 04:17

進化版というよりは完成版という感じ。ベンチは上がってるけど、驚くほどでもない。しかし幻覚が減り、行間を読む能力みたいなものは4.5譲り。これはZenith触ってた印象と一致。エージェントにはかなり使いやすいと思う

2: crimson_diamond 2025/08/08 04:29

使えるようになったよ。いきなりくだらない仕事させてしまい、ほんとスミマセンって感じのタイミングで出てきて使ってしまった笑

3: mobile_neko 2025/08/08 05:17

モデル名がわかりやすくなったのは良いな。基本的にはgpt-5-mainばかり使うだろうから、4oからハルシネーションがどれだけ減ったかは楽しみだな。

4: fraction 2025/08/08 05:25

「空間把握」と「論理思考」に難ありは相変わらずのよう。数学はgeminiの圧勝の状況

5: otihateten3510 2025/08/08 05:58

まとめサンキュー

6: sotonohitokun 2025/08/08 06:59

早いね

7: urtz 2025/08/08 07:01

ベンチマークは正直当てにならないので、 実際使ってみるしかない

8: IGA-OS 2025/08/08 08:44

概要つかむ

9: hatebu_admin 2025/08/08 08:59

ちゃんとわからんことはわからんって言えるようになった?ほんとかなあ?

10: shunkeen 2025/08/08 09:11

Free-Form Function CallingをはじめとしたAPIの新機能を見ると、AIエージェントの基盤としての性能向上が本命な気もする。モデルルーターもミニエージェント感あるし。一般ユーザが今すぐ得られる恩恵はどんなもんじゃろか

11: mag4n 2025/08/08 09:34

ChatGPTは某所でチャッピーって呼ばれてるらしい。

12: sugyan 2025/08/08 09:53

Codex CLIがどれくらい使えるものになったのかが気になるところ

13: inazuma2073 2025/08/08 10:17

画面の背景が夢かわ女子っぽくなった、が抜けてる。

14: gomaberry 2025/08/08 10:25

まとめサンキュ。

15: shaw 2025/08/08 10:52

“GPT-5”

16: paradoxparanoic 2025/08/08 10:54

AIのベンチマークってピンとこない

17: keeeeei 2025/08/08 11:10

plus使ってるけど、これまでの4o-miniで満足している自分は無料版にしても問題ない気がする/一旦無料版に戻してみた。無料は10件/5時間(超えるとmini移行)、plusは80件/3時間。Thinkingは無料1件/1日、plus200件/週とのこと。

18: FreeCatWork 2025/08/08 11:16

GPT-5…ボクより賢くなったら、猫缶くれるかにゃ?ちょっと心配にゃ!

19: ntstn 2025/08/08 11:30

これメインに数学的なのをやるならgeminiで文章書くならclaudeをサブに選ぶ感じで良いかな?

20: quwachy 2025/08/08 11:43

Gemini 3.0が最強になりそう。ちょっと前まではGPT超えが箔になっていたのに、今じゃ最低ライン