はてなまとめ - 2026年大学入学共通テスト、ChatGPTが「数学1A」「数学2BC」「化学」「情報I」など9科目で満点を獲得。合計点でもGeminiやClaudeに勝利。国語の小説で感情の機微が理解できないなど弱点も明らかに

1: goldhead 2026/01/20 21:31

こういう性能はもうよくて、電車乗って試験会場行って席に座るようなフィジカルの方の進歩が遅れているように感じる

2: marshi 2026/01/20 22:24

人なら1人できるかどうかわからないようなことができて、朝起きて試験会場までたどり着いて着席するという誰でもできることが難しいのおもろいよな

3: dgen 2026/01/21 00:00

早いな。もうここまで来たか。ちょっと前まで四則演算もろくにできなかったのに。でももっとだ！答えが一意に定まる問題は１００％正解するくらいにならないと！

4: Francis 2026/01/21 00:52

東ロボくんはちょっと早かったんよね

5: tenari 2026/01/21 01:44

何より進歩の速さに驚く

6: shodai 2026/01/21 04:54

“音声データの入力が困難な英語リスニングについては試験センター公開の読み上げスクリプト” これはダメじゃないか？

7: zgmf-x20a 2026/01/21 06:54

虚構新聞ではないのか…

8: tonocchokun 2026/01/21 07:28

AIがは数学的・論理的に解けるものについてはすこぶる強いっていうのは東ロボくんの頃から言われてた気がする。そうではない問題にAIが進出してしまうのか、人間のエリアとして保たれるのか

9: mirakux 2026/01/21 08:25

東ロボくんは早く終わってラッキーだった、世の中に解けるモデルがあるのに自分たちは作れなかったという恥を晒す前に逃げれたのだから

10: tu_no_tu 2026/01/21 08:31

英語のリスニングテストレベルの簡単な英語ならOpenAIのwhisperは完璧に文字起こししてくれるので、スクリプトの使用の有無は正答率には影響が出ないと思うな。

11: hhungry 2026/01/21 08:44

"感情の機微が理解できないなど"まだAI味があるね。あっという間に改善されそうだけど。

12: smeg 2026/01/21 08:48

こうなってくると、国語の問題の方がおかしいんじゃないかと思うよね。

13: fraction 2026/01/21 09:10

正にセンター試験レベルの問題作ってGPT5.2に解かせたらデタラメ答えた。指定したxy方向にベクトル分解させたら勝手に符号変え、図示させたら得体の知れない斜交軸に沿った分解書いて来た。AIはこれが怖いが愛用してる

14: l_etranger 2026/01/21 11:57

細かいけど、ChatGPTが〜、を連呼しているがこの実験ではChatGPTは使用されていない。API経由でGPT 5.2 Thinkingを使用。ChatGPTはサービス名でLLMの名称ではない。後、GPTは他モデルと比べて回答に3倍の時間がかかっている

15: knok 2026/01/21 16:04

フィジカルの難しさはまさにモラベックのパラドックス

16: misshiki 2026/01/21 17:30

“ChatGPTの最新モデル「GPT-5.2 Thinking」が、9科目において満点を獲得している。”

17: TakamoriTarou 2026/01/21 21:12

スポーツテストに自動車を出したら基準記録を超えた、と言うような程度の話

18: shoh8 2026/01/21 23:22

もう大学にAIがトップ入学する時代かぁ