はてなまとめ - Transformerと比較し、GPU当たり最大475倍の出力トークン数を持つ新アーキテクチャを開発

1: ahir0ta 2026/06/25 07:00

数式が欲しいな。同じ意味を束ねるところでコストがかかりそうだけど、、

2: kenjou 2026/06/25 07:45

データセンターも無限に建てられるわけじゃないし、今後は効率化の技術の重要性が増していくのかな。

3: ledsun 2026/06/25 07:56

すごいな。並のGPUでも実用的にローカルLLMを動かせるようになるのかな？

4: hogetax 2026/06/25 08:26

ここが475倍になると全体としてどれくらいの改善になるんだろう？今までと全然違う使い心地になる？

5: imash 2026/06/25 09:07

最大はレアケースじゃないのかな。通常は何倍程度なんだろう

6: wordi 2026/06/25 09:27

冒頭がうさんくさい詐欺誇大広告みたいで警戒したけど富士通か、これは凄いな

7: yuuten 2026/06/25 10:01

Transformerの説明記事もブクマされてて、はてブは勉強になるなぁと思った

8: mojimojikun 2026/06/25 10:24

なんか凄そう(小並感)

9: satomi_hanten 2026/06/25 10:51

そもそもプリフェッチ/エンコード/デコードを少なくしてGPUの多重スレッドを効率的に使おうというのが今の本流なんだと思うが、これをソフトでやっても速くなるって？本当に？

10: raitu 2026/06/25 10:52

“PHOTONは現在、大規模言語モデルの主流の基盤アーキテクチャであるTransformerの最大475倍のマルチクエリー性能”

11: sodapop444 2026/06/25 10:52

Tranfromerはこれ読んだから知ってる！https://codezine.jp/article/detail/24575 という人が増えるのでマンガ化は大事

12: kei_1010 2026/06/25 14:43

なんか凄い事を言い出したぞ。ちゃんと調べてみよ。/ 把握した。ようするに自宅PCで巨大モデルを動作させられる、みたいな話ではなく、業者がより多くのセッションを同時に処理できるようになるって話ね。

13: ys0000 2026/06/25 15:36

MoEの応用みたいなもの？内容もちゃんと把握できてないけども、実装がOSSで提供されるならちゃんと動作確認するよ。

14: hotelsekininsya 2026/06/25 17:04

PHOTON、上手い命名だ。こうした技術は使える！となるとすぐ広まるので期待したい。

15: gamecome 2026/06/25 17:17

少し出遅れたが（いつもそう）日本勢、まだまだやれてまぁす！！

16: TakamoriTarou 2026/06/25 18:47

前も似たようなことを言ってたけど実装されたっけ？