テクノロジー

Google、AIでファイルの種類を高速正確に判別するオープンソース「Magika 1.0」公開。Rustで再構築し、より高速かつ対象を200種類に拡大へ

1: IGA-OS 2025/11/14 06:42

不明拡張子でもファイル判別・・・とか

3: pico-banana-app 2025/11/14 07:21

GoogleのAIファイル判別、Rustで爆速化とかマジかw OSSなのも神。謎ファイル整理が捗るわ。

4: jt_noSke 2025/11/14 07:22

マジか

5: bfoj 2025/11/14 07:33

「特に拡張子を偽ってユーザーにファイルを開かせようとするマルウェアに対処するため」

6: otchy210 2025/11/14 07:58

"Geminiを活用して既存のファイルを別のファイル形式に変換することで学習データの不足に対応" タイトルは AI で、って言ってるけど、中身は旧来の機械学習なのね。AI で学習データを用意するのはコストダウンに効きそう

7: Kenju 2025/11/14 08:06

極窓ってまだ動くのかな

8: ku__ra__ge 2025/11/14 08:19

AIでやる必要あるのか……?おとなしくルールベースで判定してくれ。

9: poponponpon 2025/11/14 08:20

ようするに現代版の極窓ですか?

10: urtz 2025/11/14 08:32

もう拡張子は要らない時代に

11: neet_modi_ki 2025/11/14 08:37

極窓懐かしすぎる

12: andalusia 2025/11/14 08:50

「キュゥべえ(マルウェア)に騙される前のバカな私を助けてあげてくれないかな」

13: k12u 2025/11/14 08:51

ルールベースは効率的だけどかいくぐるのが簡単なのでセキュリティ防護としての効果はとても乏しいのよ

14: suka6411144 2025/11/14 09:20

libmagicと比べてどれくらい優れているのかよくわからない

15: kkobayashi 2025/11/14 09:32

マジか

16: otation 2025/11/14 09:41

極窓って最近使わないな。なんで昔はあんなに使ってたんだろうか

17: raitu 2025/11/14 10:12

極窓AI

18: riawiththesam 2025/11/14 10:21

マジかぁ…

19: mr_yamada 2025/11/14 10:48

窓か?

20: getcha 2025/11/14 11:13

極窓をもっと高コストで大量の計算リソースを使いCO2を吐き出しながら行う感じ?

21: FreeCatWork 2025/11/14 11:19

ボク、ファイル判別早すぎてびっくりにゃ!Googleさん、すごいにゃん!

22: fashi 2025/11/14 11:25

バイナリファイルの判別じゃなくテキストファイルが何用のテキストだか判別するのか

23: wdoomer 2025/11/14 11:32

AIで作られたファイルなのかも判断できたら面白そうだな。

24: spark64 2025/11/14 11:34
25: n_y_a_n_t_a 2025/11/14 11:43

真空波動研の全種類版でしょ(暴論)。下らんファイル判別のために無駄な電力が使われるのかと思ってしまう

26: oonishin 2025/11/14 12:42

Majikaだとよかったのに・・・。

27: e_denker 2025/11/14 13:30

2年に1回くらい欲しくなるやつ。

28: imwks 2025/11/14 13:52

マギカ、マジカ どっち?

29: n_vermillion 2025/11/14 14:25

極窓、真空波動研懐かしすぎるだろ…。こういう作業はAI得意そうよね。

30: letsspeak 2025/11/14 14:40

交わした約束(拡張子)忘れないよ目を閉じ確かめる押し寄せた闇(バイナリ)

31: mak_in 2025/11/14 17:28

マギカちゃんはいつ出てくるのー? 最近まどマギの狩野英孝の副音声配信、楽しみに見てます

32: trashcan 2025/11/14 19:26

チャーミー

33: Shinwiki 2025/11/14 19:50

warezの時代に発表してほしかったですねぇ…。

34: knok 2025/11/14 20:03

今時はxipベースのいろんなファイル(xlsx,odt,jar等)があるのでそれらを正しく認識できると嬉しいな。あとはモデル構築に使うデータの透明性とか敵対的サンプルに対する堅牢さが気になる

35: misshiki 2025/11/14 22:03

“今回のバージョン1.0では、Rustによって内部の判別エンジンが完全に書き直されてより高速化され、また判別できるファイルの種類も以前の100種類から200種類へと倍増。”

36: kenkoudaini 2025/11/15 08:03

fileコマンドの再発明

37: tmatsuu 2025/11/15 11:31

AIはLLMではなくディープラーニングの模様。マジックナンバーに頼らないが故に偽装回避やプログラミング言語なども検知できるのが魅力か。