プロンプト調整したらもっと精度あがりそう
Excel方眼紙も読んでくれるだろうか
いいテストだなぁ
llm使い荒くて草
Gemini 3のマルチモーダル機能は他と比べて段違いに良い模様ですね!
gemini は2.5の時から画像読み取り精度良いなと感じてる。
このチャレンジいいですね 私もスキャンした書類の分類や命名でAIを補助に使ってたりするし、そちら方面でもっと使いたいと思ってたので、いい評価だなーと思いました
逆に恐ろしいのがChatGPT。曖昧なところを自分でわかっている。“20個ある商品のうち4個しか抽出できていません。自信のない部分は出力しないという安全策をとっているようです”
チラチャンでも実運用はむずい
2.5 flashの方が精度いいよ。あとpro系は時間かかる。
95%くらいになったら教えて欲しい。
Gemini 2.5 flashの方が精度良いよな、と思ったら既コメだった
“Gemini1.5のときからこのチラシチャレンジやVision性能はかなり高いと理解してましたが、今回のGemini 3のVision性能は、更に精度が向上したのでは!?と感じさせられました。”
“使用するのは、情報量が多くレイアウトが複雑な「スーパー玉出」のチラシです。 タスクは、チラシ内の「木 27日 限り」という特定の枠内にある商品情報をすべて抜き出すことです。”
GPT がClaude よりも画像解析能力が高いのは体感的にわかってたけど、Gemini そうなんだ。
これはなかなか実用的な評価方法かも。
Gemini3 ProのVision性能をチラシチャレンジしてみた
プロンプト調整したらもっと精度あがりそう
Excel方眼紙も読んでくれるだろうか
いいテストだなぁ
llm使い荒くて草
Gemini 3のマルチモーダル機能は他と比べて段違いに良い模様ですね!
gemini は2.5の時から画像読み取り精度良いなと感じてる。
このチャレンジいいですね 私もスキャンした書類の分類や命名でAIを補助に使ってたりするし、そちら方面でもっと使いたいと思ってたので、いい評価だなーと思いました
逆に恐ろしいのがChatGPT。曖昧なところを自分でわかっている。“20個ある商品のうち4個しか抽出できていません。自信のない部分は出力しないという安全策をとっているようです”
チラチャンでも実運用はむずい
2.5 flashの方が精度いいよ。あとpro系は時間かかる。
95%くらいになったら教えて欲しい。
Gemini 2.5 flashの方が精度良いよな、と思ったら既コメだった
“Gemini1.5のときからこのチラシチャレンジやVision性能はかなり高いと理解してましたが、今回のGemini 3のVision性能は、更に精度が向上したのでは!?と感じさせられました。”
“使用するのは、情報量が多くレイアウトが複雑な「スーパー玉出」のチラシです。 タスクは、チラシ内の「木 27日 限り」という特定の枠内にある商品情報をすべて抜き出すことです。”
GPT がClaude よりも画像解析能力が高いのは体感的にわかってたけど、Gemini そうなんだ。
これはなかなか実用的な評価方法かも。