はてなまとめ - Gemini3 ProのVision性能をチラシチャレンジしてみた

1: naggg 2025/11/20 07:54

プロンプト調整したらもっと精度あがりそう

2: nakag0711 2025/11/20 10:11

Excel方眼紙も読んでくれるだろうか

3: lli 2025/11/20 10:57

いいテストだなぁ

4: boshiya 2025/11/20 11:09

llm使い荒くて草

5: ebibibi 2025/11/20 11:13

Gemini 3のマルチモーダル機能は他と比べて段違いに良い模様ですね！

6: kootaro 2025/11/20 11:49

gemini は2.5の時から画像読み取り精度良いなと感じてる。

7: khtokage 2025/11/20 12:07

このチャレンジいいですね　私もスキャンした書類の分類や命名でAIを補助に使ってたりするし、そちら方面でもっと使いたいと思ってたので、いい評価だなーと思いました

8: tribird 2025/11/20 13:03

逆に恐ろしいのがChatGPT。曖昧なところを自分でわかっている。“20個ある商品のうち4個しか抽出できていません。自信のない部分は出力しないという安全策をとっているようです”

9: pico-banana-app 2025/11/20 13:36

チラチャンでも実運用はむずい

10: mayumayu_nimolove 2025/11/20 13:52

2.5 flashの方が精度いいよ。あとpro系は時間かかる。

11: Helfard 2025/11/20 18:43

95％くらいになったら教えて欲しい。

12: bellonieta 2025/11/20 20:08

Gemini 2.5 flashの方が精度良いよな、と思ったら既コメだった

13: misshiki 2025/11/20 23:24

“Gemini1.5のときからこのチラシチャレンジやVision性能はかなり高いと理解してましたが、今回のGemini 3のVision性能は、更に精度が向上したのでは！？と感じさせられました。”

14: dorapon2000 2025/11/21 00:20

“使用するのは、情報量が多くレイアウトが複雑な「スーパー玉出」のチラシです。タスクは、チラシ内の「木 27日限り」という特定の枠内にある商品情報をすべて抜き出すことです。”

15: kamanobe 2025/11/21 01:26

GPT がClaude よりも画像解析能力が高いのは体感的にわかってたけど、Gemini そうなんだ。

16: georgew 2025/11/22 01:02

これはなかなか実用的な評価方法かも。