進化版というよりは完成版という感じ。ベンチは上がってるけど、驚くほどでもない。しかし幻覚が減り、行間を読む能力みたいなものは4.5譲り。これはZenith触ってた印象と一致。エージェントにはかなり使いやすいと思う
使えるようになったよ。いきなりくだらない仕事させてしまい、ほんとスミマセンって感じのタイミングで出てきて使ってしまった笑
モデル名がわかりやすくなったのは良いな。基本的にはgpt-5-mainばかり使うだろうから、4oからハルシネーションがどれだけ減ったかは楽しみだな。
「空間把握」と「論理思考」に難ありは相変わらずのよう。数学はgeminiの圧勝の状況
まとめサンキュー
早いね
ベンチマークは正直当てにならないので、 実際使ってみるしかない
概要つかむ
ちゃんとわからんことはわからんって言えるようになった?ほんとかなあ?
Free-Form Function CallingをはじめとしたAPIの新機能を見ると、AIエージェントの基盤としての性能向上が本命な気もする。モデルルーターもミニエージェント感あるし。一般ユーザが今すぐ得られる恩恵はどんなもんじゃろか
ChatGPTは某所でチャッピーって呼ばれてるらしい。
Codex CLIがどれくらい使えるものになったのかが気になるところ
画面の背景が夢かわ女子っぽくなった、が抜けてる。
まとめサンキュ。
“GPT-5”
AIのベンチマークってピンとこない
plus使ってるけど、これまでの4o-miniで満足している自分は無料版にしても問題ない気がする/一旦無料版に戻してみた。無料は10件/5時間(超えるとmini移行)、plusは80件/3時間。Thinkingは無料1件/1日、plus200件/週とのこと。
GPT-5…ボクより賢くなったら、猫缶くれるかにゃ?ちょっと心配にゃ!
これメインに数学的なのをやるならgeminiで文章書くならclaudeをサブに選ぶ感じで良いかな?
Gemini 3.0が最強になりそう。ちょっと前まではGPT超えが箔になっていたのに、今じゃ最低ライン
GPT-5 まとめ
進化版というよりは完成版という感じ。ベンチは上がってるけど、驚くほどでもない。しかし幻覚が減り、行間を読む能力みたいなものは4.5譲り。これはZenith触ってた印象と一致。エージェントにはかなり使いやすいと思う
使えるようになったよ。いきなりくだらない仕事させてしまい、ほんとスミマセンって感じのタイミングで出てきて使ってしまった笑
モデル名がわかりやすくなったのは良いな。基本的にはgpt-5-mainばかり使うだろうから、4oからハルシネーションがどれだけ減ったかは楽しみだな。
「空間把握」と「論理思考」に難ありは相変わらずのよう。数学はgeminiの圧勝の状況
まとめサンキュー
早いね
ベンチマークは正直当てにならないので、 実際使ってみるしかない
概要つかむ
ちゃんとわからんことはわからんって言えるようになった?ほんとかなあ?
Free-Form Function CallingをはじめとしたAPIの新機能を見ると、AIエージェントの基盤としての性能向上が本命な気もする。モデルルーターもミニエージェント感あるし。一般ユーザが今すぐ得られる恩恵はどんなもんじゃろか
ChatGPTは某所でチャッピーって呼ばれてるらしい。
Codex CLIがどれくらい使えるものになったのかが気になるところ
画面の背景が夢かわ女子っぽくなった、が抜けてる。
まとめサンキュ。
“GPT-5”
AIのベンチマークってピンとこない
plus使ってるけど、これまでの4o-miniで満足している自分は無料版にしても問題ない気がする/一旦無料版に戻してみた。無料は10件/5時間(超えるとmini移行)、plusは80件/3時間。Thinkingは無料1件/1日、plus200件/週とのこと。
GPT-5…ボクより賢くなったら、猫缶くれるかにゃ?ちょっと心配にゃ!
これメインに数学的なのをやるならgeminiで文章書くならclaudeをサブに選ぶ感じで良いかな?
Gemini 3.0が最強になりそう。ちょっと前まではGPT超えが箔になっていたのに、今じゃ最低ライン