はてなまとめ - 画像認識AIモデル「Qwen3-VL」の軽量版が登場したので使ってみた、低いVRAM使用量で高性能を実現

1: mr_mayama 2025/10/26 06:08

めちゃ実用的

2: fashi 2025/10/26 12:40

Nexa SDKとやらが必要だとLM Studioではまだ利用できないか(MacではMLX版が使えるようだ)

3: otoan52 2025/10/26 16:36

良さそう。以前他のモデルでレシートの各項目を読ませたときは実用的な精度が出なくて、GoogleDriveのOCRで文字読み取りしたあとに、表の精度を上げるために調整に使ってたんだけど、thinkだしそろそろ一発でいけるかな？

4: star_123 2025/10/26 19:35

手持ちの全ての撮影画像に説明文付けて､タグ付けとかもやってくれるアプリとか作れないかな時間かかってもいいからローカルで動いてほしい

5: kojikoji75 2025/10/26 23:20

“今回テストした機材は以下の通りです。4Bモデルであれば快適に動作しました。・CPU：Intel(R) Core(TM) Ultra 5 125U ・メモリ：64GB ・GPU：NVIDIA GeForce RTX 2060 SUPER 8GB”

6: haru_tw 2025/10/27 21:46

使ってみたがどう活用したらいいか今の俺には分からなかった

7: misshiki 2025/10/28 00:05

“Qwen2.5-VL-72Bに匹敵する性能を発揮するとのことで試しにローカルPCにインストールして使ってみました。”