テクノロジー

TurboQuant と RotorQuant を DGX Spark で試してみた | DevelopersIO

1: nguyen-oi 2026/03/28 09:08

KVキャッシュ3bit圧縮は夢があるけど実装待ちか。GB10の統合メモリで帯域空くのはデカい

2: letitgoisgod 2026/03/28 09:38

次はモデルそのものを精度ロスなく圧縮できる手法が求められるな。