はてなまとめ - 大学入学共通テスト、OpenAIは9科目満点　得点率97%でGoogleに勝利

1: taketake89 2026/01/20 06:50

“17〜18日実施の大学入学共通テストに最新の人工知能モデルが挑戦したところ、米オープンAIは主要15科目のうち9科目で満点を取った。全体の得点率は97%に達し、米グーグルや米アンソロピック（ともに91%）を上回った”

2: otihateten3510 2026/01/20 08:33

うーんやっぱそうだよなあ、体感とあってる。なんかGemini最強説湧いてるのってどっからなんだろう？難題にはGeminiの方が良いとか？チャッピーはややウザイが正答率は高いと思う

3: mayumayu_nimolove 2026/01/20 08:34

チャッピーはメジャリテイだな

4: TourEiffel 2026/01/20 08:35

すごいな

5: straychef 2026/01/20 08:46

これはひどい　カンニングに使われたら

6: verda 2026/01/20 08:51

すげー時代になったもんだな人間が学ぶ内容というか形式？自体を変える時がきてるのかもしれない

7: soratomo 2026/01/20 08:56

基礎の教養をおろそかにしてる人と、豊富な基礎を応用できる人との格差がますます拡がるんじゃないだろうか。

8: kazgeo 2026/01/20 08:58

東ロボくん…。

9: mazzo 2026/01/20 09:11

受験産業終了のお知らせ。ChatGPT先生にすべて教えてもらえばよいのだ。完全カスタマイズで、志望校にあった学力がつく

10: cardmics 2026/01/20 09:28

外国語を学ぶ必要はない。なぜなら翻訳機が発達するからだ…という主張はよくあるが、そのうち、「知識を暗記する必要はない。なぜならAIが教えてくれるからだ」という主張がされる時代がくるのかもね。

11: etah 2026/01/20 09:32

最近話題になった人間が解決できなかった数学のエルデシュ問題を解いてしまったAIもOpenAIのGPT5.2だったもんな

12: getcha 2026/01/20 09:35

Gemini が 91％の正解というのは逆に驚き。もっと噓を付いてる印象があった。/ Gemini 最強論は Google のアフィリエイトと、ユーザー側の SEOを気にした行動の結果だと思う。

13: nnn7kun 2026/01/20 09:50

でも僕はAIで勉強するのが好きなんだなぁ

14: obsv 2026/01/20 09:52

“数学のⅠAとⅡBC、化学、化学基礎、物理基礎、地学基礎、生物基礎、情報Ⅰ、公共・政治経済の9科目で満点だった。同社のモデルは2024年の共通テスト解答率の66%から25年に91%を達成し、26年に97%に上昇した。”

15: aya_momo 2026/01/20 10:04

もう忘れているかもしれないけど、東ロボくんはその当時のAIの実力を測るものだったんだよ。10年以上前だから高得点を取れなくてもしょうがない。深層学習前だし。当時の延長線ではダメだということを示した。

16: itukawapar60 2026/01/20 10:04

そりゃそうだろ

17: takanq 2026/01/20 10:12

逆になに間違えたか知りたい、AIが誤答するくらいのクソ問とか言われるのだろうか

18: ayakohiroe 2026/01/20 10:29

“25年はオープンAIが91%の得点率を達成し、東大の2次試験でも理科Ⅲ類の合格レベルの成績だった”

19: kj03 2026/01/20 10:33

やはり推論はジェミニよりチャッピーが強いんだな。

20: xsde 2026/01/20 10:40

これって人間側の条件を揃えると教科書・参考書持ち込んだら9科目満点だったという意味にはならないのだろうか // 人間の脳にあわせてAIを電力10Wに制限してみるとどうかな。

21: garaxyz 2026/01/20 10:41

人間が今の受験内容を勉強する必要はもうなくなった

22: igni3 2026/01/20 10:44

筆者の気持ちがわかるAI。そんな問題はないが。

23: mohno 2026/01/20 10:52

「大学入学共通テストに最新の人工知能（AI）モデルが挑戦したところ、米オープンAIは主要15科目のうち9科目で満点を取った。全体の得点率は97%に達し、米グーグルや米アンソロピック（ともに91%）を上回った」

24: xev 2026/01/20 10:53

図形問題もちゃんと解けたんか

25: soulfulmiddleagedman 2026/01/20 10:55

理解はしてないんだよな。あらためてどういう仕組みなのか、不思議というか。

26: bashibashi_77 2026/01/20 10:56

ここまできたら算数で話題になるかけ算の順番も間違えないやろうか。

27: wwolf 2026/01/20 10:57

東ロボくんの人って未だに読解力でAIに張り合おうとしてるってマジですか

28: wildhog 2026/01/20 10:58

以前GPT4oに類題作ってもらって解答と解説も作ってもらったらまちがってたことあったけど…

29: c_shiika 2026/01/20 11:10

GPT、新しいモデルになってから歴史のこととか聞くと間違ったこと言わなくなった印象があるもんな。一方で最新情報にはちょっと疎いというかかなりあやふやなことがあるので、何でも知ってるおじいちゃんみがある。

30: exshouqosa 2026/01/20 11:11

チャッピー合格おめでとう

31: mshkh 2026/01/20 11:15

東ロボくんは過去のものになりにけり。まあしようがない、研究ではよくあること

32: takeishi 2026/01/20 11:15

オープンAIはもう共通テストなら難関大学行けるレベルか。

33: Outfielder 2026/01/20 11:28

例えば地歴だと単なる知識問題は絶滅して、資料解釈の妥当性判定が多数で、これは｢AIがつく嘘を見抜けるか｣｢資料を曲解して歴史を曲げたりしないか｣を問うてる。AIが満点取ったから勝った負けたとかの話ではない

34: hiroshima_pot 2026/01/20 11:29

東ロボくんは過去の文脈でも愚かだったということを何度でも繰り返したい。当時の技術でできないということは何も証明しなかったし、そこから読解力が云々言い出したのはさらに愚か。

35: beerbeerkun 2026/01/20 11:47

少なくともAIに質問したり壁打ちする知識は必要だから当分の間は変わらんよ。設問傾向は変わるかもしれんがかつてのセンター試験とはすでにかなり変わってるみたいだしな。

36: kagerouttepaso 2026/01/20 12:07

優秀な部下にのびのびと能力を発揮させる出来の悪い上司スキルが求められる時代が来る。

37: augsUK 2026/01/20 12:08

東ロボプロジェクトは当時の研究レベルとしても深層学習に完全に乗り遅れていて、挙げ句の果てに子供の読解力論に逃げた最悪クラスな国プロなので。断念宣言したのは2016年末で深層学習全盛の時ね。

38: tekitou-manga 2026/01/20 12:08

カンニングの環境さえ整えば⋯⋯という話だよねこれ

39: toshiyam 2026/01/20 12:11

謎のクソゲーを英文で説明されて理解出来なかったりしてほしい

40: kazuhix 2026/01/20 12:16

ネットにつなげないスタンドアローン、つまりローカル環境でやれるようになってからまた来てください。給電はバッテリーだけな。そもそもお前ら問題用紙すらめくれないやろ

41: kusomamma 2026/01/20 12:18

Google検索の上位互換なんだから、予備校がつくった模範回答みてるだけじゃねーの？

42: odz 2026/01/20 12:20

東ロボくんは深層学習前というブコメがあるけど、東ロボくんやってたのが2011年、深層学習の登場が2006年なので……。一般に知られるようになったのは2012年以降だとは思うけど。

43: morita_non 2026/01/20 12:21

東ロボくんはいまこそ総括してほしい。あの当時はまあアレでよかったとして。

44: sumomo-kun 2026/01/20 12:24

俺たちブクマカとちがって、ちゃんと問題文を読むし、無関係な自分語りをせず、聞かれたことを答えるほどの国語能力があるってのかよ…？

45: ono332 2026/01/20 12:27

学習塾や家庭教師業界は危機感を持った方がいい、のかもしれない（わからん）

46: abhuzl 2026/01/20 12:30

10年前はディープラーニング余裕であったろ。Transformerが出てくるのはだいぶ後だけど。

47: Windfola 2026/01/20 12:31

東ロボ2011-2015、Transformer 2017。身体性の欠如という欠陥はまだ克服されてないけど、テキスト上の正解出すだけなら確率だけでクリアできちゃったね。／東ロボ、理数だけなら合格圏じゃなかった？

48: fusionstar 2026/01/20 12:37

入試問題を作る側も AI にチェックしてもらえるから楽になるかも。

49: NEXTAltair 2026/01/20 12:39

東ロボくんは有り余る資金とハードウェアはなかったから｡Transformer は発表が2017年でこれがパラダイムシフトな

50: Insite 2026/01/20 12:48

うちの子（96.5%）に勝ったのか。英国社だと確率が高いのを選ぶだけだし、その他は計算がいりそうだけど得意分野だし、そんなものだろう

51: deztecjp 2026/01/20 12:54

ネット遮断環境でも、その結果になるのだろうか。

52: khtokage 2026/01/20 12:56

意外と差があってびっくり／Gemini最強論はコスパと使い勝手の話ですね。月3kで、共通テスト91点100万トークンのLLM、画像等の生成、NotebookLMが使える。車で言えば今回はエンジンの話、Gemini論は装備やエコシステムの話。

53: zakkie 2026/01/20 13:01

“特に地理では日本地図の都道府県の色分けや、グラフと地図を組み合わせて解く問題で失点した。物理では円形波と平面波が干渉する問題で3モデルともに誤答するなど、不規則な図を特に苦手とすることがわかった。”

54: ckis 2026/01/20 13:07

そんな問題より、各AIの皆様に今話題の灘中の国語を解かせてその回答を出してほしい。

55: toenobu 2026/01/20 13:24

This is embarrassing.

56: pokepirk 2026/01/20 13:36

東ロボくんは「ビッグデータと深層学習を利用した統計的学習という現在のAI理論ではこれ以上の成績向上は不可能」という結論を出したんだけど、深層学習以前とか大嘘書いてる人に星つけるのやめようね

57: agrisearch 2026/01/20 14:01

チャットGPT

58: ntstn 2026/01/20 14:50

GeminiはGoogleの各サービスとの連携が最大の強みだと思ってるけどね。メインはChatGPT使ってるが。

59: yas-mal 2026/01/20 15:09

↓東ロボくんは、"2021年東大合格"を掲げて2011年に開始して2016年に断念。AI業界では2006年にDNNの論文が出ていて、2012年にAlexNetの衝撃。…という時系列。

60: bellonieta 2026/01/20 15:50

新井紀子先生も絶対このニュースを見てるはずなのにコメントは出さない

61: misshiki 2026/01/20 16:19

“オープンAIは主要15科目のうち9科目で満点を取った。全体の得点率は97%に達し、米グーグルや米アンソロピック（ともに91%）を上回った。AIが難関大入学レベルの知能を備え、幅広いデスクワークを担える能力を示した”

62: taguch1 2026/01/20 16:25

学力じゃないものが人間に求められてるけど中間管理職はそれ以上のものを求められる。

63: matchy2 2026/01/20 16:53

勉強おしゃべりクソ野郎

64: hevohevo 2026/01/20 17:00

「当時の技術的枠組みと計算資源の延長では、大学入試において人間レベルに到達する見通しは立たない」が東ロボ（2013-2016）の結論。なお現在の圧倒的な性能の基盤となるTransformer論文は2017です。タイミング悪すぎわろた

65: kuippa 2026/01/20 17:47

Rehackの高橋Dが数学とかで100点とってたとか聞いて100点はすごいわーとおっちょこちょい派の俺はおもいましたとさ。俺のハルシネーションはAIより酷いってことなんだろうね。

66: yamadadadada2 2026/01/20 18:18

チャットでの推論の強さはGPTが頭一つ抜けてるのは感じる。コーディングではOpus一択なんだけども。

67: theatrical 2026/01/20 18:24

コスパを考えるとDeepseek-v3.2が最強。ただし天安門事件を否定したり、毛沢東や習近平を称賛するような人間になるリスクはある

68: tyosuke2011 2026/01/20 18:25

AIもテストするんかい

69: umi-be 2026/01/20 18:31

逆に人間が得意そうな課題解決みたいな問題にしてもAIのほうが良い回答をしそうな気がする

70: tokuniimihanai 2026/01/20 18:34

東ロボはtransformer革命以前だから比較するのは不公平／ChatGPTはそこまで賢く無いよね。どのくらいの電力を使ったのか。

71: raitu 2026/01/20 18:53

大学入学共通テスト"米オープンAIは主要15科目のうち9科目で満点を取った。全体の得点率は97%に達し、米グーグルや米アンソロピック（ともに91%）を上回った"

72: nmcli 2026/01/20 19:47

共テがベンチマーク化してるの笑う

73: ayumun 2026/01/20 19:55

ベルばら問題解けたのかな

74: samu_i 2026/01/20 20:00

ChatGPTはほんとうにChatになったかんじがある。

75: ET777 2026/01/20 20:29

ええ…なんか憎たらしいわ（ライバル意識

76: LM-7 2026/01/20 20:49

東ロボプロジェクト https://21robot.org/index.html の成果で今まだ役に立つ知見はどれだけあるのだろうか

77: hatebutabooboo 2026/01/20 21:57

"東大卒"みたいな価値も段々落ちていくのかな

78: nhayato 2026/01/20 23:29

東ロボ、機関別（教科別）でアプローチ違った気がするからすべてブコメが間違ってるというわけでもない（私の当時の所属企業が構成機関ではあったが、内部情報は何も知らない）

79: Galaxy42 2026/01/21 01:27

試験はAIに任せておろかな人類は楽しいことだけやっていたい

80: mozukuyummy 2026/01/21 05:51

教科書・参考書持ち込み可なら、東大受験生ならこれくらい出せそうではある

81: georgew 2026/01/21 14:38

いくつかのブコメ同様に自分も東ロボくんを想起し、完全に過去の人になったとしみじみ思った次第。

大学入学共通テスト、OpenAIは9科目満点 得点率97%でGoogleに勝利 - 日本経済新聞

大学入学共通テスト、OpenAIは9科目満点　得点率97%でGoogleに勝利 - 日本経済新聞