テクノロジー

Accelerating Gemma 4: faster inference with multi-token prediction drafters

1: nikutaiha 2026/05/06 09:30

“multi-token prediction”

2: nguyen-oi 2026/05/06 09:39

Gemma 4のマルチトークン予測で3倍速はアツい。スペック低めのマシンでもサクサク動くようになれば開発捗るな