「知能の正体はただの確率計算」という夢のない現実に数学のお墨付きがついたわけだ
過程は全く違うのに、結果だけ見ればさも人間が考えたかのように見えるのは人間のバグ過ぎる
自分の思考能力の低さが時々嫌になるだけど、もしかしたら、この低さだから出てくるものがあるかもしれませんね…と、すこしだけ前向きになれたかも
AGIになれない、はその通りなんだけど、結局資本家の目的は「真の知性を作る事」じゃなくて「凡人労働者を駆逐する事」でしかないので、現状のAIで充分なんだよね、腹立たしい事に。
なるほど、となると自然言語ではなく数学で考えるメリットも問題をシンプルに出来ることにあるのかもね
“少なくとも今年中に人間の知能を超える技術にはならないだろう、という見方を裏付ける証拠となりました。イーロン・マスクは「今年中に人間の知能を超える」と言い張ってますけどね。”
例えば、貧困で教育を受けられなかった人間でも、知性を感じることはある。逆も然りで、知識の量はその人の知性を保証しない。AIを使っているとそれを感じる。閃きのような妙案を出す知性はまだ人間の領域。
それで人間だとすぐにひらめかないような新しい仮説や組み合わせを出力して試行錯誤を効率化して研究速度が加速してるの面白いよな。
シンプルにゴミ論文では??????
arxivで実質5ページ、読む気にもならん。解散。
どこら辺が限界なのさ
俺は「今の」AIについてはずーっと懐疑的なんだが、こういう論文出てもテック企業は大言壮語を吹き続けて、そのうち致命的にとんでもないことになりそうだから嫌なんだよな。
なら人間ならこの壁を越えられるか。人間も超えられないなら人間の最高到達点と同程度のAGIを作る事は可能だし、人間が(数学的に定義できる)xxの理由で超えられるならその仕組みを取り入れてAIを改良できる。
「昨年アップルの研究者たちがLLMは実際に推論したり考えたりしているわけではなく、そう見せているにすぎないという結論の論文を発表」多くの人がLLMの仕組みを理解してないが故にAIが「考えてる」と思い込んでる
幕内が無理でも普通の人にとっては十分恐怖を覚える能力です
LLMの本質を誤解してる論文なんで無価値。確率分布を計算量で評価しようとしてる。査読通った論文でもない。WIREDの記事がクソ
DOIを検索すら不能。時間の無駄なのでしらべるのやーめた。たぶん無価値
このタイミングでこの情報はちょっと危険だな
実際今のAIはごく表層的にしか物事を判断できないなと感じる。明示されてない関係性を見抜くのは苦手だし、この延長線上に知性があるとはとても思えない。
元ネタの論文はこれのよう https://arxiv.org/abs/2507.07505 論文と言ってもこのサイトは査読無し論文を掲載可能だし、証明も数式がほとんど無い英文11行。これでLLMの限界が数学的に証明されたとはとても思えない。
いやいや人間も実際に厳密な推論しているわけない。その意味でイーロンの指摘は正しい。日常生活ならそれっぽい答えで十分なのよ。
??
今のllmでも100kトークン越えた辺りからコーディング品質落ちる感じがある。各llmメーカーの作成工程に依るんだろうけど
限界限界言ってるけどそれもう1年後どうなってるのとかわからないだろ
ちょうど良い塩梅じゃない。本当に超えられたらそれはそれで困るし。少なくとも俺が逃げ切るまでは超える技術は出てこないと嬉しい。
そも、人類の何%が複雑でないエージェント的タスクを間違えずにこなせるか?と言う出発点が…。あと単純に純化すべきタスクは24H並列で出来るなら人類の方が負けるだろ
何の限界かしらないがAppleの発表は人に合わせてただけという根本的な間違いが指摘されていたし、LLMではないけど別に世界モデルを持つ、RLとかでそんな限界とか関係ないでしょうね。
ブクマカはソースを確認しないから、内容が薄すぎて価値がないと読んだら一目で分かる低質論文のタイトルだけで騒ぐ驚き屋に釣られる。あまりにみっともない
モデルの性能を超える複雑なタスクが出来ないって当然では?その複雑度の上限が書いてあるの?
今のAIでAGIまで行けて欲しいと思う層がいるのと同じぐらい、今のAIは大したものではなく限界があって欲しいと思う層もいて、科学的検証とは別にイデオロギー闘争的なところがある。まあ私も人間なんかぶっちぎって略
だから、7割程度は任せられるけど、一番時間がかかる残りは任せられないのが現状。
多数のAIでチームを組んで仕事をさせる場合はどうなんだろうね
論文が正しいとしてもLLMの限界なだけで、別の仕組みのモデルがAGIを達成する可能性はありそう
既に東大理三を余裕で合格するレベルのに、人間を超えられないとは?
関数に抽象化して圧縮はされてるみたいだけどな。(コルモゴロフの重ね合わせ定理)時間がかかり過ぎて実用にならないというのは人間の限界だけど。
とりあえずTransfomerのモデルと中国語の部屋を調べてからなんか書け
人間でもそうなるじゃん?>「要求された行動を最後まで実行できなかったり、誤った形でタスクを実行してしまったりする」/逆に「限界以下の人材はAIで代替可能」と考えられちゃったりするかも?
今のままだとデータの引き出し方がちょっと特殊な大規模データベース以上のものにはなれない気はする。何かもう一ひねりいるんじゃないの
元になっている論文( https://arxiv.org/abs/2507.07505 )は、数学的と言っても計算オーダーの議論しかしていない。論文は、乱暴に例えるなら、自信満々の小学生に中学校の問題を出したら間違うよね、という話をしているだけ
パパの名前を使った箔付けなんだろうけど、杜撰じゃないですかね。ただこのレベルなら代筆じゃないだろうしまだマシと見るべきか
ってかさー、正しいことだけを学習させてるわけでもなく、結果が正しいことを検証しないのに、結果が正しいことが保証できるの?スカイネットを怖がらない人が多くてビックリするんだけど。
「イーロンの予想とは正反対」じゃ、当たってるよ。
これはLLMを計算機としてとらえた場合の話で、それなら人間もできない。LLMはコードを書いて実行環境も使えるし、推論で論理を積み上げてエージェント的に試行錯誤もできる。この過程の強化学習でまだまだ伸びると思う
↓「 人間も実際に厳密な推論しているわけない。」今年の2月まではAIが論理的推論している様子全くなかった。人間は100%確実な論理をケアレスミスするが、今のところAIは100%正しい推論する確率が90%から99.9%になった感じ
自分の処理能力を超えた複雑なタスクを求められた人間も最後までそれを完遂できないだろうし、無理矢理やろうとしたら誤った形で実行するだろうから、その間違い方は人間とあんまり変わらなくね?
拡張思考チャッピーが必死に否定してきた😂 “この論文は、「LLMは本質的に無能だ」という話ではなく、LLMを厳密計算機・最適化ソルバー・形式検証器として裸で使うのは危険だ という警告として読むのが適切です”
単純に世の中殆どの問題は正解が存在してないなかで、AIの性能が上がっても人間的なタスクは正解らしそうという人間に近い答えが限界になるのは当たり前では?
俺の頭はすでにAGAに到達しているのに、AIはまだAGIに到達してないのか。
人間がLLMの限界を認識できると思うのは傲慢だと思う。他人のことがわかり得ないのと同程度に、モデルのパターン認識は「観測しきれない」。理解可能な指標で「測る」のがせいぜい。なぜ自分はLLMより「上」だと?
知性ってなんだろうな。 結局人間だって、解いたことある問題とか類似問題しかとけないんだからAIと変わらんだろ
推論で深掘りできる量とトークンとして覚えておける量の積が一定ぽいので、時間を掛ければいいものでは無さそうなんだよな。
「手に負えない問題を手に負えないと判断できない」のは信頼性の問題としてはそりゃ残るだろうが、「人間を超える超えない」とは全く関係無いんじゃ……。
ブコメ参考になる
この記事について自分の記事内で言及した。AGIは無理でAIバブルは早くて年内、遅くても2028年中に弾けると思う。https://kei-1010.hatenablog.com/entry/2026/01/04/152542
LLMは一定以上に複雑な計算的・エージェント的タスクを実行できないとする研究を紹介。Vishal Sikka氏とVarin Sikka氏の論文をもとに、エージェント型AIやAGI期待への現実的な上限を論じる。
LLMが「越えられない壁」。AIの限界点が数学的に証明された
「知能の正体はただの確率計算」という夢のない現実に数学のお墨付きがついたわけだ
過程は全く違うのに、結果だけ見ればさも人間が考えたかのように見えるのは人間のバグ過ぎる
自分の思考能力の低さが時々嫌になるだけど、もしかしたら、この低さだから出てくるものがあるかもしれませんね…と、すこしだけ前向きになれたかも
AGIになれない、はその通りなんだけど、結局資本家の目的は「真の知性を作る事」じゃなくて「凡人労働者を駆逐する事」でしかないので、現状のAIで充分なんだよね、腹立たしい事に。
なるほど、となると自然言語ではなく数学で考えるメリットも問題をシンプルに出来ることにあるのかもね
“少なくとも今年中に人間の知能を超える技術にはならないだろう、という見方を裏付ける証拠となりました。イーロン・マスクは「今年中に人間の知能を超える」と言い張ってますけどね。”
例えば、貧困で教育を受けられなかった人間でも、知性を感じることはある。逆も然りで、知識の量はその人の知性を保証しない。AIを使っているとそれを感じる。閃きのような妙案を出す知性はまだ人間の領域。
それで人間だとすぐにひらめかないような新しい仮説や組み合わせを出力して試行錯誤を効率化して研究速度が加速してるの面白いよな。
シンプルにゴミ論文では??????
arxivで実質5ページ、読む気にもならん。解散。
どこら辺が限界なのさ
俺は「今の」AIについてはずーっと懐疑的なんだが、こういう論文出てもテック企業は大言壮語を吹き続けて、そのうち致命的にとんでもないことになりそうだから嫌なんだよな。
なら人間ならこの壁を越えられるか。人間も超えられないなら人間の最高到達点と同程度のAGIを作る事は可能だし、人間が(数学的に定義できる)xxの理由で超えられるならその仕組みを取り入れてAIを改良できる。
「昨年アップルの研究者たちがLLMは実際に推論したり考えたりしているわけではなく、そう見せているにすぎないという結論の論文を発表」多くの人がLLMの仕組みを理解してないが故にAIが「考えてる」と思い込んでる
幕内が無理でも普通の人にとっては十分恐怖を覚える能力です
LLMの本質を誤解してる論文なんで無価値。確率分布を計算量で評価しようとしてる。査読通った論文でもない。WIREDの記事がクソ
DOIを検索すら不能。時間の無駄なのでしらべるのやーめた。たぶん無価値
このタイミングでこの情報はちょっと危険だな
実際今のAIはごく表層的にしか物事を判断できないなと感じる。明示されてない関係性を見抜くのは苦手だし、この延長線上に知性があるとはとても思えない。
元ネタの論文はこれのよう https://arxiv.org/abs/2507.07505 論文と言ってもこのサイトは査読無し論文を掲載可能だし、証明も数式がほとんど無い英文11行。これでLLMの限界が数学的に証明されたとはとても思えない。
いやいや人間も実際に厳密な推論しているわけない。その意味でイーロンの指摘は正しい。日常生活ならそれっぽい答えで十分なのよ。
??
今のllmでも100kトークン越えた辺りからコーディング品質落ちる感じがある。各llmメーカーの作成工程に依るんだろうけど
限界限界言ってるけどそれもう1年後どうなってるのとかわからないだろ
ちょうど良い塩梅じゃない。本当に超えられたらそれはそれで困るし。少なくとも俺が逃げ切るまでは超える技術は出てこないと嬉しい。
そも、人類の何%が複雑でないエージェント的タスクを間違えずにこなせるか?と言う出発点が…。あと単純に純化すべきタスクは24H並列で出来るなら人類の方が負けるだろ
何の限界かしらないがAppleの発表は人に合わせてただけという根本的な間違いが指摘されていたし、LLMではないけど別に世界モデルを持つ、RLとかでそんな限界とか関係ないでしょうね。
ブクマカはソースを確認しないから、内容が薄すぎて価値がないと読んだら一目で分かる低質論文のタイトルだけで騒ぐ驚き屋に釣られる。あまりにみっともない
モデルの性能を超える複雑なタスクが出来ないって当然では?その複雑度の上限が書いてあるの?
今のAIでAGIまで行けて欲しいと思う層がいるのと同じぐらい、今のAIは大したものではなく限界があって欲しいと思う層もいて、科学的検証とは別にイデオロギー闘争的なところがある。まあ私も人間なんかぶっちぎって略
だから、7割程度は任せられるけど、一番時間がかかる残りは任せられないのが現状。
多数のAIでチームを組んで仕事をさせる場合はどうなんだろうね
論文が正しいとしてもLLMの限界なだけで、別の仕組みのモデルがAGIを達成する可能性はありそう
既に東大理三を余裕で合格するレベルのに、人間を超えられないとは?
関数に抽象化して圧縮はされてるみたいだけどな。(コルモゴロフの重ね合わせ定理)時間がかかり過ぎて実用にならないというのは人間の限界だけど。
とりあえずTransfomerのモデルと中国語の部屋を調べてからなんか書け
人間でもそうなるじゃん?>「要求された行動を最後まで実行できなかったり、誤った形でタスクを実行してしまったりする」/逆に「限界以下の人材はAIで代替可能」と考えられちゃったりするかも?
今のままだとデータの引き出し方がちょっと特殊な大規模データベース以上のものにはなれない気はする。何かもう一ひねりいるんじゃないの
元になっている論文( https://arxiv.org/abs/2507.07505 )は、数学的と言っても計算オーダーの議論しかしていない。論文は、乱暴に例えるなら、自信満々の小学生に中学校の問題を出したら間違うよね、という話をしているだけ
パパの名前を使った箔付けなんだろうけど、杜撰じゃないですかね。ただこのレベルなら代筆じゃないだろうしまだマシと見るべきか
ってかさー、正しいことだけを学習させてるわけでもなく、結果が正しいことを検証しないのに、結果が正しいことが保証できるの?スカイネットを怖がらない人が多くてビックリするんだけど。
「イーロンの予想とは正反対」じゃ、当たってるよ。
これはLLMを計算機としてとらえた場合の話で、それなら人間もできない。LLMはコードを書いて実行環境も使えるし、推論で論理を積み上げてエージェント的に試行錯誤もできる。この過程の強化学習でまだまだ伸びると思う
↓「 人間も実際に厳密な推論しているわけない。」今年の2月まではAIが論理的推論している様子全くなかった。人間は100%確実な論理をケアレスミスするが、今のところAIは100%正しい推論する確率が90%から99.9%になった感じ
自分の処理能力を超えた複雑なタスクを求められた人間も最後までそれを完遂できないだろうし、無理矢理やろうとしたら誤った形で実行するだろうから、その間違い方は人間とあんまり変わらなくね?
拡張思考チャッピーが必死に否定してきた😂 “この論文は、「LLMは本質的に無能だ」という話ではなく、LLMを厳密計算機・最適化ソルバー・形式検証器として裸で使うのは危険だ という警告として読むのが適切です”
単純に世の中殆どの問題は正解が存在してないなかで、AIの性能が上がっても人間的なタスクは正解らしそうという人間に近い答えが限界になるのは当たり前では?
俺の頭はすでにAGAに到達しているのに、AIはまだAGIに到達してないのか。
人間がLLMの限界を認識できると思うのは傲慢だと思う。他人のことがわかり得ないのと同程度に、モデルのパターン認識は「観測しきれない」。理解可能な指標で「測る」のがせいぜい。なぜ自分はLLMより「上」だと?
知性ってなんだろうな。 結局人間だって、解いたことある問題とか類似問題しかとけないんだからAIと変わらんだろ
推論で深掘りできる量とトークンとして覚えておける量の積が一定ぽいので、時間を掛ければいいものでは無さそうなんだよな。
「手に負えない問題を手に負えないと判断できない」のは信頼性の問題としてはそりゃ残るだろうが、「人間を超える超えない」とは全く関係無いんじゃ……。
ブコメ参考になる
この記事について自分の記事内で言及した。AGIは無理でAIバブルは早くて年内、遅くても2028年中に弾けると思う。https://kei-1010.hatenablog.com/entry/2026/01/04/152542
LLMは一定以上に複雑な計算的・エージェント的タスクを実行できないとする研究を紹介。Vishal Sikka氏とVarin Sikka氏の論文をもとに、エージェント型AIやAGI期待への現実的な上限を論じる。