Excel方眼紙も読んでくれるだろうか
いいテストだなぁ
llm使い荒くて草
Gemini 3のマルチモーダル機能は他と比べて段違いに良い模様ですね!
gemini は2.5の時から画像読み取り精度良いなと感じてる。
このチャレンジいいですね 私もスキャンした書類の分類や命名でAIを補助に使ってたりするし、そちら方面でもっと使いたいと思ってたので、いい評価だなーと思いました
逆に恐ろしいのがChatGPT。曖昧なところを自分でわかっている。“20個ある商品のうち4個しか抽出できていません。自信のない部分は出力しないという安全策をとっているようです”
チラチャンでも実運用はむずい
2.5 flashの方が精度いいよ。あとpro系は時間かかる。
Gemini3 ProのVision性能をチラシチャレンジしてみた
Excel方眼紙も読んでくれるだろうか
いいテストだなぁ
llm使い荒くて草
Gemini 3のマルチモーダル機能は他と比べて段違いに良い模様ですね!
gemini は2.5の時から画像読み取り精度良いなと感じてる。
このチャレンジいいですね 私もスキャンした書類の分類や命名でAIを補助に使ってたりするし、そちら方面でもっと使いたいと思ってたので、いい評価だなーと思いました
逆に恐ろしいのがChatGPT。曖昧なところを自分でわかっている。“20個ある商品のうち4個しか抽出できていません。自信のない部分は出力しないという安全策をとっているようです”
チラチャンでも実運用はむずい
2.5 flashの方が精度いいよ。あとpro系は時間かかる。