はてなまとめ - AIトークンの9割はゴミだった

1: izure 2026/06/02 12:03

大抵のものの9割はゴミだし、だからこそ裾野の広さが大事になってくる。

2: myr 2026/06/02 12:32

そのゴミが重要だし人生大半ゴミだし、人間同士の話で情報量みたいな話をしたら1割未満だと思うし。俺の好きな広東語で「廢話」ってのがあってずっと話してるどうでもいい無駄話とかの意味だぞ。いいじゃんそれで。

3: koroha-a 2026/06/02 12:33

これはすごい。試してみたいがまだ実用段階ではないんだろうか "Headroomは、LLMに送られるコンテキストウィンドウ(モデルが一度に読む入力と出力の全領域)の中身を、モデルに届く前に圧縮する"

4: hazel_pluto 2026/06/02 12:35

AIは、意味を理解してないし、理解する必要もなく、結局のところ人間の価値判断が必要になる。人間による最終調整、責任者としての確認が必要。確率を上げることはできるけど、そこに至るまでゴミを生み出し続ける。

5: oosin 2026/06/02 12:53

通貨かと思ったら生成AIの話だった。ネットフリックスのエンジニアがローカルでプロンプトを圧縮するオープンソースのツールを開発して全世界で一億円以上のコストを削減したと。すげえ。

6: apto117 2026/06/02 12:59

試してみようと思ったらRTKで既に実装してたわ。

7: crimson_diamond 2026/06/02 13:04

↓ゴミという言葉に反発してる人たち、要点はそこじゃなくて、ゴミにお金を余計に払わないといけないという話なのだし、このゴミは中間生成物（メタデータ）でコンテキストですらないのだが？

8: deep_one 2026/06/02 13:24

「Headroomが投げかけている問いは、実はツールの話ではない。LLMに送っている情報の大半が本当に必要なのか、という構造的な問いだ」なぜ「データ」と「指示」の入力経路が同一なのかとか、LLMは基本がおかしい。

9: eirun 2026/06/02 13:25

スタージョンの法則「SFの90%はゴミである。ただし、あらゆるものの90%はゴミである」

10: misshiki 2026/06/02 14:38

Netflixのエンジニアが、LLMに送るトークンの最大90%は冗長だとし、事前にコンテキストを圧縮するOSS「Project Headroom」を開発。AIコーディング費用の膨張に一石。

11: IKANOicardo 2026/06/02 14:41

結局コスト論にいくならそんだけ払っても有り余るくらいエンジニアをレイオフしてんだろーがという話になる。CO2排出についての議論になるなら十分道義的に追求されるべきだと思う。

12: ejointjp 2026/06/02 14:44

人生のほとんどもゴミ、地球のほとんどもゴミ、宇宙のほとんどもゴミ。

13: RySa 2026/06/02 15:17

そりゃAIプラットフォーム提供側は利益を生むトークン数を減らす方向の努力はしないでしょうよ。やるのは他社との競争原理が働いた場合か、AIの計算資源確保の苦労がトークンの利益を上回ってからでしょうね。