めちゃ実用的
Nexa SDKとやらが必要だとLM Studioではまだ利用できないか(MacではMLX版が使えるようだ)
良さそう。以前他のモデルでレシートの各項目を読ませたときは実用的な精度が出なくて、GoogleDriveのOCRで文字読み取りしたあとに、表の精度を上げるために調整に使ってたんだけど、thinkだしそろそろ一発でいけるかな?
手持ちの全ての撮影画像に説明文付けて、タグ付けとかもやってくれるアプリとか作れないかな時間かかってもいいからローカルで動いてほしい
“今回テストした機材は以下の通りです。4Bモデルであれば快適に動作しました。 ・CPU:Intel(R) Core(TM) Ultra 5 125U ・メモリ:64GB ・GPU:NVIDIA GeForce RTX 2060 SUPER 8GB”
使ってみたがどう活用したらいいか今の俺には分からなかった
“Qwen2.5-VL-72Bに匹敵する性能を発揮するとのことで試しにローカルPCにインストールして使ってみました。”
画像認識AIモデル「Qwen3-VL」の軽量版が登場したので使ってみた、低いVRAM使用量で高性能を実現
めちゃ実用的
Nexa SDKとやらが必要だとLM Studioではまだ利用できないか(MacではMLX版が使えるようだ)
良さそう。以前他のモデルでレシートの各項目を読ませたときは実用的な精度が出なくて、GoogleDriveのOCRで文字読み取りしたあとに、表の精度を上げるために調整に使ってたんだけど、thinkだしそろそろ一発でいけるかな?
手持ちの全ての撮影画像に説明文付けて、タグ付けとかもやってくれるアプリとか作れないかな時間かかってもいいからローカルで動いてほしい
“今回テストした機材は以下の通りです。4Bモデルであれば快適に動作しました。 ・CPU:Intel(R) Core(TM) Ultra 5 125U ・メモリ:64GB ・GPU:NVIDIA GeForce RTX 2060 SUPER 8GB”
使ってみたがどう活用したらいいか今の俺には分からなかった
“Qwen2.5-VL-72Bに匹敵する性能を発揮するとのことで試しにローカルPCにインストールして使ってみました。”