“17〜18日実施の大学入学共通テストに最新の人工知能モデルが挑戦したところ、米オープンAIは主要15科目のうち9科目で満点を取った。全体の得点率は97%に達し、米グーグルや米アンソロピック(ともに91%)を上回った”
うーんやっぱそうだよなあ、体感とあってる。なんかGemini最強説湧いてるのってどっからなんだろう?難題にはGeminiの方が良いとか?チャッピーはややウザイが正答率は高いと思う
チャッピーはメジャリテイだな
すごいな
これはひどい カンニングに使われたら
すげー時代になったもんだな 人間が学ぶ内容というか 形式?自体を変える時がきてるのかもしれない
基礎の教養をおろそかにしてる人と、豊富な基礎を応用できる人との格差がますます拡がるんじゃないだろうか。
東ロボくん…。
受験産業終了のお知らせ。ChatGPT先生にすべて教えてもらえばよいのだ。完全カスタマイズで、志望校にあった学力がつく
外国語を学ぶ必要はない。なぜなら翻訳機が発達するからだ…という主張はよくあるが、そのうち、「知識を暗記する必要はない。なぜならAIが教えてくれるからだ」という主張がされる時代がくるのかもね。
最近話題になった人間が解決できなかった数学のエルデシュ問題を解いてしまったAIもOpenAIのGPT5.2だったもんな
Gemini が 91%の正解というのは逆に驚き。もっと噓を付いてる印象があった。/ Gemini 最強論は Google のアフィリエイトと、ユーザー側の SEOを気にした行動の結果だと思う。
でも僕はAIで勉強するのが好きなんだなぁ
“数学のⅠAとⅡBC、化学、化学基礎、物理基礎、地学基礎、生物基礎、情報Ⅰ、公共・政治経済の9科目で満点だった。同社のモデルは2024年の共通テスト解答率の66%から25年に91%を達成し、26年に97%に上昇した。”
もう忘れているかもしれないけど、東ロボくんはその当時のAIの実力を測るものだったんだよ。10年以上前だから高得点を取れなくてもしょうがない。深層学習前だし。当時の延長線ではダメだということを示した。
そりゃそうだろ
逆になに間違えたか知りたい、AIが誤答するくらいのクソ問とか言われるのだろうか
“25年はオープンAIが91%の得点率を達成し、東大の2次試験でも理科Ⅲ類の合格レベルの成績だった”
やはり推論はジェミニよりチャッピーが強いんだな。
これって人間側の条件を揃えると教科書・参考書持ち込んだら9科目満点だったという意味にはならないのだろうか。
人間が今の受験内容を勉強する必要はもうなくなった
筆者の気持ちがわかるAI。そんな問題はないが。
「大学入学共通テストに最新の人工知能(AI)モデルが挑戦したところ、米オープンAIは主要15科目のうち9科目で満点を取った。全体の得点率は97%に達し、米グーグルや米アンソロピック(ともに91%)を上回った」
図形問題もちゃんと解けたんか
理解はしてないんだよな。あらためてどういう仕組みなのか、不思議というか。
ここまできたら算数で話題になるかけ算の順番も間違えないやろうか。
東ロボくんの人って未だに読解力でAIに張り合おうとしてるってマジですか
以前GPT4oに類題作ってもらって解答と解説も作ってもらったらまちがってたことあったけど…
GPT、新しいモデルになってから歴史のこととか聞くと間違ったこと言わなくなった印象があるもんな。一方で最新情報にはちょっと疎いというかかなりあやふやなことがあるので、何でも知ってるおじいちゃんみがある。
チャッピー合格おめでとう
東ロボくんは過去のものになりにけり。まあしようがない、研究ではよくあること
オープンAIはもう共通テストなら難関大学行けるレベルか。
例えば地歴だと単なる知識問題は絶滅して、資料解釈の妥当性判定が多数で、これは「AIがつく嘘を見抜けるか」「資料を曲解して歴史を曲げたりしないか」を問うてる。AIが満点取ったから勝った負けたとかの話ではない
東ロボくんは過去の文脈でも愚かだったということを何度でも繰り返したい。当時の技術でできないということは何も証明しなかったし、そこから読解力が云々言い出したのはさらに愚か。
少なくともAIに質問したり壁打ちする知識は必要だから当分の間は変わらんよ。設問傾向は変わるかもしれんがかつてのセンター試験とはすでにかなり変わってるみたいだしな。
優秀な部下にのびのびと能力を発揮させる出来の悪い上司スキルが求められる時代が来る。
東ロボプロジェクトは当時の研究レベルとしても深層学習に完全に乗り遅れていて、挙げ句の果てに子供の読解力論に逃げた最悪クラスな国プロなので。断念宣言したのは2016年末で深層学習全盛の時ね。
カンニングの環境さえ整えば⋯⋯という話だよねこれ
謎のクソゲーを英文で説明されて理解出来なかったりしてほしい
ネットにつなげないスタンドアローン、つまりローカル環境でやれるようになってからまた来てください。給電はバッテリーだけな。そもそもお前ら問題用紙すらめくれないやろ
Google検索の上位互換なんだから、予備校がつくった模範回答みてるだけじゃねーの?
東ロボくんは深層学習前というブコメがあるけど、東ロボくんやってたのが2011年、深層学習の登場が2006年なので……。一般に知られるようになったのは2012年以降だとは思うけど。
東ロボくんはいまこそ総括してほしい。あの当時はまあアレでよかったとして。
俺たちブクマカとちがって、ちゃんと問題文を読むし、無関係な自分語りをせず、聞かれたことを答えるほどの国語能力があるってのかよ…?
学習塾や家庭教師業界は危機感を持った方がいい、のかもしれない(わからん)
10年前はディープラーニング余裕であったろ。Transformerが出てくるのはだいぶ後だけど。
東ロボ2011-2015、Transformer 2017。身体性の欠如という欠陥はまだ克服されてないけど、テキスト上の正解出すだけなら確率だけでクリアできちゃったね。/東ロボ、理数だけなら合格圏じゃなかった?
入試問題を作る側も AI にチェックしてもらえるから楽になるかも。
東ロボくんは有り余る資金とハードウェアはなかったから。Transformer は発表が2017年でこれがパラダイムシフトな
うちの子(96.5%)に勝ったのか。英国社だと確率が高いのを選ぶだけだし、その他は計算がいりそうだけど得意分野だし、そんなものだろう
ネット遮断環境でも、その結果になるのだろうか。
意外と差があってびっくり/Gemini最強論はコスパと使い勝手の話ですね。月3kで、共通テスト91点100万トークンのLLM、画像等の生成、NotebookLMが使える。車で言えば今回はエンジンの話、Gemini論は装備やエコシステムの話。
“特に地理では日本地図の都道府県の色分けや、グラフと地図を組み合わせて解く問題で失点した。物理では円形波と平面波が干渉する問題で3モデルともに誤答するなど、不規則な図を特に苦手とすることがわかった。”
そんな問題より、各AIの皆様に今話題の灘中の国語を解かせてその回答を出してほしい。
This is embarrassing.
東ロボくんは「ビッグデータと深層学習を利用した統計的学習という現在のAI理論ではこれ以上の成績向上は不可能」という結論を出したんだけど、深層学習以前とか大嘘書いてる人に星つけるのやめようね
チャットGPT
GeminiはGoogleの各サービスとの連携が最大の強みだと思ってるけどね。メインはChatGPT使ってるが。
↓東ロボくんは、"2021年東大合格"を掲げて2011年に開始して2016年に断念。AI業界では2006年にDNNの論文が出ていて、2012年にAlexNetの衝撃。…という時系列。
新井紀子先生も絶対このニュースを見てるはずなのにコメントは出さない
“オープンAIは主要15科目のうち9科目で満点を取った。全体の得点率は97%に達し、米グーグルや米アンソロピック(ともに91%)を上回った。AIが難関大入学レベルの知能を備え、幅広いデスクワークを担える能力を示した”
学力じゃないものが人間に求められてるけど中間管理職はそれ以上のものを求められる。
勉強おしゃべりクソ野郎
「当時の技術的枠組みと計算資源の延長では、大学入試において人間レベルに到達する見通しは立たない」が東ロボ(2013-2016)の結論。なお現在の圧倒的な性能の基盤となるTransformer論文は2017です。タイミング悪すぎわろた
Rehackの高橋Dが数学とかで100点とってたとか聞いて100点はすごいわーとおっちょこちょい派の俺はおもいましたとさ。俺のハルシネーションはAIより酷いってことなんだろうね。
チャットでの推論の強さはGPTが頭一つ抜けてるのは感じる。コーディングではOpus一択なんだけども。
コスパを考えるとDeepseek-v3.2が最強。ただし天安門事件を否定したり、毛沢東や習近平を称賛するような人間になるリスクはある
AIもテストするんかい
逆に人間が得意そうな課題解決みたいな問題にしてもAIのほうが良い回答をしそうな気がする
東ロボはtransformer革命以前だから比較するのは不公平/ChatGPTはそこまで賢く無いよね。どのくらいの電力を使ったのか。
大学入学共通テスト"米オープンAIは主要15科目のうち9科目で満点を取った。全体の得点率は97%に達し、米グーグルや米アンソロピック(ともに91%)を上回った"
共テがベンチマーク化してるの笑う
ベルばら問題解けたのかな
ChatGPTはほんとうにChatになったかんじがある。
ええ…なんか憎たらしいわ(ライバル意識
東ロボプロジェクト https://21robot.org/index.html の成果で今まだ役に立つ知見はどれだけあるのだろうか
"東大卒"みたいな価値も段々落ちていくのかな
大学入学共通テスト、OpenAIは9科目満点 得点率97%でGoogleに勝利 - 日本経済新聞
“17〜18日実施の大学入学共通テストに最新の人工知能モデルが挑戦したところ、米オープンAIは主要15科目のうち9科目で満点を取った。全体の得点率は97%に達し、米グーグルや米アンソロピック(ともに91%)を上回った”
うーんやっぱそうだよなあ、体感とあってる。なんかGemini最強説湧いてるのってどっからなんだろう?難題にはGeminiの方が良いとか?チャッピーはややウザイが正答率は高いと思う
チャッピーはメジャリテイだな
すごいな
これはひどい カンニングに使われたら
すげー時代になったもんだな 人間が学ぶ内容というか 形式?自体を変える時がきてるのかもしれない
基礎の教養をおろそかにしてる人と、豊富な基礎を応用できる人との格差がますます拡がるんじゃないだろうか。
東ロボくん…。
受験産業終了のお知らせ。ChatGPT先生にすべて教えてもらえばよいのだ。完全カスタマイズで、志望校にあった学力がつく
外国語を学ぶ必要はない。なぜなら翻訳機が発達するからだ…という主張はよくあるが、そのうち、「知識を暗記する必要はない。なぜならAIが教えてくれるからだ」という主張がされる時代がくるのかもね。
最近話題になった人間が解決できなかった数学のエルデシュ問題を解いてしまったAIもOpenAIのGPT5.2だったもんな
Gemini が 91%の正解というのは逆に驚き。もっと噓を付いてる印象があった。/ Gemini 最強論は Google のアフィリエイトと、ユーザー側の SEOを気にした行動の結果だと思う。
でも僕はAIで勉強するのが好きなんだなぁ
“数学のⅠAとⅡBC、化学、化学基礎、物理基礎、地学基礎、生物基礎、情報Ⅰ、公共・政治経済の9科目で満点だった。同社のモデルは2024年の共通テスト解答率の66%から25年に91%を達成し、26年に97%に上昇した。”
もう忘れているかもしれないけど、東ロボくんはその当時のAIの実力を測るものだったんだよ。10年以上前だから高得点を取れなくてもしょうがない。深層学習前だし。当時の延長線ではダメだということを示した。
そりゃそうだろ
逆になに間違えたか知りたい、AIが誤答するくらいのクソ問とか言われるのだろうか
“25年はオープンAIが91%の得点率を達成し、東大の2次試験でも理科Ⅲ類の合格レベルの成績だった”
やはり推論はジェミニよりチャッピーが強いんだな。
これって人間側の条件を揃えると教科書・参考書持ち込んだら9科目満点だったという意味にはならないのだろうか。
人間が今の受験内容を勉強する必要はもうなくなった
筆者の気持ちがわかるAI。そんな問題はないが。
「大学入学共通テストに最新の人工知能(AI)モデルが挑戦したところ、米オープンAIは主要15科目のうち9科目で満点を取った。全体の得点率は97%に達し、米グーグルや米アンソロピック(ともに91%)を上回った」
図形問題もちゃんと解けたんか
理解はしてないんだよな。あらためてどういう仕組みなのか、不思議というか。
ここまできたら算数で話題になるかけ算の順番も間違えないやろうか。
東ロボくんの人って未だに読解力でAIに張り合おうとしてるってマジですか
以前GPT4oに類題作ってもらって解答と解説も作ってもらったらまちがってたことあったけど…
GPT、新しいモデルになってから歴史のこととか聞くと間違ったこと言わなくなった印象があるもんな。一方で最新情報にはちょっと疎いというかかなりあやふやなことがあるので、何でも知ってるおじいちゃんみがある。
チャッピー合格おめでとう
東ロボくんは過去のものになりにけり。まあしようがない、研究ではよくあること
オープンAIはもう共通テストなら難関大学行けるレベルか。
例えば地歴だと単なる知識問題は絶滅して、資料解釈の妥当性判定が多数で、これは「AIがつく嘘を見抜けるか」「資料を曲解して歴史を曲げたりしないか」を問うてる。AIが満点取ったから勝った負けたとかの話ではない
東ロボくんは過去の文脈でも愚かだったということを何度でも繰り返したい。当時の技術でできないということは何も証明しなかったし、そこから読解力が云々言い出したのはさらに愚か。
少なくともAIに質問したり壁打ちする知識は必要だから当分の間は変わらんよ。設問傾向は変わるかもしれんがかつてのセンター試験とはすでにかなり変わってるみたいだしな。
優秀な部下にのびのびと能力を発揮させる出来の悪い上司スキルが求められる時代が来る。
東ロボプロジェクトは当時の研究レベルとしても深層学習に完全に乗り遅れていて、挙げ句の果てに子供の読解力論に逃げた最悪クラスな国プロなので。断念宣言したのは2016年末で深層学習全盛の時ね。
カンニングの環境さえ整えば⋯⋯という話だよねこれ
謎のクソゲーを英文で説明されて理解出来なかったりしてほしい
ネットにつなげないスタンドアローン、つまりローカル環境でやれるようになってからまた来てください。給電はバッテリーだけな。そもそもお前ら問題用紙すらめくれないやろ
Google検索の上位互換なんだから、予備校がつくった模範回答みてるだけじゃねーの?
東ロボくんは深層学習前というブコメがあるけど、東ロボくんやってたのが2011年、深層学習の登場が2006年なので……。一般に知られるようになったのは2012年以降だとは思うけど。
東ロボくんはいまこそ総括してほしい。あの当時はまあアレでよかったとして。
俺たちブクマカとちがって、ちゃんと問題文を読むし、無関係な自分語りをせず、聞かれたことを答えるほどの国語能力があるってのかよ…?
学習塾や家庭教師業界は危機感を持った方がいい、のかもしれない(わからん)
10年前はディープラーニング余裕であったろ。Transformerが出てくるのはだいぶ後だけど。
東ロボ2011-2015、Transformer 2017。身体性の欠如という欠陥はまだ克服されてないけど、テキスト上の正解出すだけなら確率だけでクリアできちゃったね。/東ロボ、理数だけなら合格圏じゃなかった?
入試問題を作る側も AI にチェックしてもらえるから楽になるかも。
東ロボくんは有り余る資金とハードウェアはなかったから。Transformer は発表が2017年でこれがパラダイムシフトな
うちの子(96.5%)に勝ったのか。英国社だと確率が高いのを選ぶだけだし、その他は計算がいりそうだけど得意分野だし、そんなものだろう
ネット遮断環境でも、その結果になるのだろうか。
意外と差があってびっくり/Gemini最強論はコスパと使い勝手の話ですね。月3kで、共通テスト91点100万トークンのLLM、画像等の生成、NotebookLMが使える。車で言えば今回はエンジンの話、Gemini論は装備やエコシステムの話。
“特に地理では日本地図の都道府県の色分けや、グラフと地図を組み合わせて解く問題で失点した。物理では円形波と平面波が干渉する問題で3モデルともに誤答するなど、不規則な図を特に苦手とすることがわかった。”
そんな問題より、各AIの皆様に今話題の灘中の国語を解かせてその回答を出してほしい。
This is embarrassing.
東ロボくんは「ビッグデータと深層学習を利用した統計的学習という現在のAI理論ではこれ以上の成績向上は不可能」という結論を出したんだけど、深層学習以前とか大嘘書いてる人に星つけるのやめようね
チャットGPT
GeminiはGoogleの各サービスとの連携が最大の強みだと思ってるけどね。メインはChatGPT使ってるが。
↓東ロボくんは、"2021年東大合格"を掲げて2011年に開始して2016年に断念。AI業界では2006年にDNNの論文が出ていて、2012年にAlexNetの衝撃。…という時系列。
新井紀子先生も絶対このニュースを見てるはずなのにコメントは出さない
“オープンAIは主要15科目のうち9科目で満点を取った。全体の得点率は97%に達し、米グーグルや米アンソロピック(ともに91%)を上回った。AIが難関大入学レベルの知能を備え、幅広いデスクワークを担える能力を示した”
学力じゃないものが人間に求められてるけど中間管理職はそれ以上のものを求められる。
勉強おしゃべりクソ野郎
「当時の技術的枠組みと計算資源の延長では、大学入試において人間レベルに到達する見通しは立たない」が東ロボ(2013-2016)の結論。なお現在の圧倒的な性能の基盤となるTransformer論文は2017です。タイミング悪すぎわろた
Rehackの高橋Dが数学とかで100点とってたとか聞いて100点はすごいわーとおっちょこちょい派の俺はおもいましたとさ。俺のハルシネーションはAIより酷いってことなんだろうね。
チャットでの推論の強さはGPTが頭一つ抜けてるのは感じる。コーディングではOpus一択なんだけども。
コスパを考えるとDeepseek-v3.2が最強。ただし天安門事件を否定したり、毛沢東や習近平を称賛するような人間になるリスクはある
AIもテストするんかい
逆に人間が得意そうな課題解決みたいな問題にしてもAIのほうが良い回答をしそうな気がする
東ロボはtransformer革命以前だから比較するのは不公平/ChatGPTはそこまで賢く無いよね。どのくらいの電力を使ったのか。
大学入学共通テスト"米オープンAIは主要15科目のうち9科目で満点を取った。全体の得点率は97%に達し、米グーグルや米アンソロピック(ともに91%)を上回った"
共テがベンチマーク化してるの笑う
ベルばら問題解けたのかな
ChatGPTはほんとうにChatになったかんじがある。
ええ…なんか憎たらしいわ(ライバル意識
東ロボプロジェクト https://21robot.org/index.html の成果で今まだ役に立つ知見はどれだけあるのだろうか
"東大卒"みたいな価値も段々落ちていくのかな