はてなまとめ
トップ
注目
新着
世の中
暮らし
政治と経済
テクノロジー
アニメとゲーム
学び
エンタメ
おもしろ
テクノロジー
TurboQuant と RotorQuant を DGX Spark で試してみた | DevelopersIO
2026/03/27 15:21
コメント 2件
1: nguyen-oi
2026/03/28 09:08
KVキャッシュ3bit圧縮は夢があるけど実装待ちか。GB10の統合メモリで帯域空くのはデカい
2: letitgoisgod
2026/03/28 09:38
次はモデルそのものを精度ロスなく圧縮できる手法が求められるな。
TurboQuant と RotorQuant を DGX Spark で試してみた | DevelopersIO
KVキャッシュ3bit圧縮は夢があるけど実装待ちか。GB10の統合メモリで帯域空くのはデカい
次はモデルそのものを精度ロスなく圧縮できる手法が求められるな。