Gemini 3.1 ProはARC-AGI-2で77.1%を記録し、Gemini APIやVertex AI、Gemini appで利用可能な高度な推論モデルです。
Gemini 3.1 Proとか更新早すぎ。ARC-AGIでスコア激増は凄いけど、これもう人間がついていけない領域に入ってる
3 proはパフォーマンスエンジニアリングで使ってると「もう十分だよ、良くやってると思うよ」なんてフリーレンみたいな言い草で怠けようとするから結局sonnet/opusに切り替えてるけど、3.1では改善されてるといいなぁ。
Gemini単体使いに比べてCLI等でコード触らせに行った方が何故か精度悪化するのは解消されているのだろうか…
3が去年11月。Claudeに注目が集まったのが1月。そして3.1が2月。GPT5が微妙でスケーリング則は終わったとか言われてたのに
ジェミニ → クロード → ジーピーティー
スケーリング則は終わってるから推論だとかツール利用とかマルチエージェントとか色々やっているわけでしょ。
先にVeoが3.1だったからややっこしい
ほほー
おれもさっき気づいた。
とある界隈ではひよこ通らないと阿鼻叫喚の様相
AA-Omniscience Hallucination Rateのスコア上昇が目覚ましい。わからないと言えるGeminiは最強かもしれない。
Gemini 3.1 Proは推論性能と自律開発能力を強化したGoogleの最新モデル。ARC-AGI-2など抽象推論で大幅改善し、100万トークン文脈やコード実行に対応。Vertex AIやGemini CLIで提供され、AIエージェント開発を強く意識する。
Gemini 3.1 Pro: A smarter model for your most complex tasks
Gemini 3.1 ProはARC-AGI-2で77.1%を記録し、Gemini APIやVertex AI、Gemini appで利用可能な高度な推論モデルです。
Gemini 3.1 Proとか更新早すぎ。ARC-AGIでスコア激増は凄いけど、これもう人間がついていけない領域に入ってる
3 proはパフォーマンスエンジニアリングで使ってると「もう十分だよ、良くやってると思うよ」なんてフリーレンみたいな言い草で怠けようとするから結局sonnet/opusに切り替えてるけど、3.1では改善されてるといいなぁ。
Gemini単体使いに比べてCLI等でコード触らせに行った方が何故か精度悪化するのは解消されているのだろうか…
3が去年11月。Claudeに注目が集まったのが1月。そして3.1が2月。GPT5が微妙でスケーリング則は終わったとか言われてたのに
ジェミニ → クロード → ジーピーティー
スケーリング則は終わってるから推論だとかツール利用とかマルチエージェントとか色々やっているわけでしょ。
先にVeoが3.1だったからややっこしい
ほほー
おれもさっき気づいた。
とある界隈ではひよこ通らないと阿鼻叫喚の様相
AA-Omniscience Hallucination Rateのスコア上昇が目覚ましい。わからないと言えるGeminiは最強かもしれない。
Gemini 3.1 Proは推論性能と自律開発能力を強化したGoogleの最新モデル。ARC-AGI-2など抽象推論で大幅改善し、100万トークン文脈やコード実行に対応。Vertex AIやGemini CLIで提供され、AIエージェント開発を強く意識する。