Claude CodeのWebFetchはHaikuで要約して渡し、10万文字超は後半が切り捨てられると解説する。
via https://x.com/zhizhiarv/status/2051251679920886187
要約だけ読まされて全文理解したつもりになるのは確かに罠すぎる
まぁ合理的ではあるよな(´-`)というかページ分割されてるソースで次も読んで欲しい
え、そりゃそうだろ……検索したページ全文をOPUSに読ませたらいろんな意味でやばいでしょ。
/status を見るとやたらHaikuを使っていると思ったらここだったのか
“短い要約しか、あなたの賢い Opus や Sonnet には届いていません”
しらなかった
Gemini CLIのGoogleSearchツールよりは少しマシかも。友人の盗難車検索に使ってたけどハルシネーションの伝言ゲームみたいな地獄が展開され、俺に届くころには冗談みたいな嘘の塊に。URLを示すことすらできなかった。
とりあえずcurlを許可するのがいいのかなぁ
“WebFetch ツールを使う多くの場合、実は Web ページの原文を読んでいません。先に Haiku が読んで要約・抽出した結果だけを、あなたの Opus や Sonnet が読んで実装を進めています。”
なるほど
相変わらずって感じなんだな
ちゃんと読んでくれるツール難民
claude Opusモデルをbedrock上で走らせると、なぜかコストレポート上Haikuの方が多く請求されてて謎だったが、こういうことか…
ツール使わせたほうがいい場合は多そう
はてな俳句 ClaudeHaiku
“問題は、これらの設計判断自体ではなく、それがユーザーに見えにくいことです。”そやね。むしろ利点が多い
「ハイクを詠め、クロード・コード=サン」
合理的なやり方ではあるなぁ。すべてフルスペックでやるのは効率が悪い。
ほほー「個人的には defuddle parse URL --md を使っています。defuddle は Obsidian の CEO kepano が作ったURLをMarkdownなどにパースしてくれる」
ちゃんと目的が明確だとそれように抽出してくれる……けどtruncate入っちゃうと厄介よな……
“もちろん defuddle を使うと、Haiku が第一フィルタとして担っていたと思われる Prompt Injection 対策は外れ” / まずHaikuに読ませるのはセキュリティ対策でもあったわけか。それ聞くと外しにくいな
このドキュメントは気合入れて読めよ って指示するだけじゃダメ?文章をインプットする作業ならHaikuで充分ってことなんでしょうか。(本文をちゃんと読んでいない)
現在では全文を安価なLLMに前処理(要約やフィルター)させた後に読む仕様らしい。/configからverboseオンで挙動を確認できる。MDN等一部のサイトは例外として登録されている。
あなたのClaude CodeのWebFetch、実はWebをちゃんと読んでいない
Claude CodeのWebFetchはHaikuで要約して渡し、10万文字超は後半が切り捨てられると解説する。
via https://x.com/zhizhiarv/status/2051251679920886187
要約だけ読まされて全文理解したつもりになるのは確かに罠すぎる
まぁ合理的ではあるよな(´-`)というかページ分割されてるソースで次も読んで欲しい
え、そりゃそうだろ……検索したページ全文をOPUSに読ませたらいろんな意味でやばいでしょ。
/status を見るとやたらHaikuを使っていると思ったらここだったのか
“短い要約しか、あなたの賢い Opus や Sonnet には届いていません”
しらなかった
Gemini CLIのGoogleSearchツールよりは少しマシかも。友人の盗難車検索に使ってたけどハルシネーションの伝言ゲームみたいな地獄が展開され、俺に届くころには冗談みたいな嘘の塊に。URLを示すことすらできなかった。
とりあえずcurlを許可するのがいいのかなぁ
“WebFetch ツールを使う多くの場合、実は Web ページの原文を読んでいません。先に Haiku が読んで要約・抽出した結果だけを、あなたの Opus や Sonnet が読んで実装を進めています。”
なるほど
相変わらずって感じなんだな
ちゃんと読んでくれるツール難民
claude Opusモデルをbedrock上で走らせると、なぜかコストレポート上Haikuの方が多く請求されてて謎だったが、こういうことか…
ツール使わせたほうがいい場合は多そう
はてな俳句 ClaudeHaiku
“問題は、これらの設計判断自体ではなく、それがユーザーに見えにくいことです。”そやね。むしろ利点が多い
「ハイクを詠め、クロード・コード=サン」
合理的なやり方ではあるなぁ。すべてフルスペックでやるのは効率が悪い。
ほほー「個人的には defuddle parse URL --md を使っています。defuddle は Obsidian の CEO kepano が作ったURLをMarkdownなどにパースしてくれる」
ちゃんと目的が明確だとそれように抽出してくれる……けどtruncate入っちゃうと厄介よな……
“もちろん defuddle を使うと、Haiku が第一フィルタとして担っていたと思われる Prompt Injection 対策は外れ” / まずHaikuに読ませるのはセキュリティ対策でもあったわけか。それ聞くと外しにくいな
このドキュメントは気合入れて読めよ って指示するだけじゃダメ?文章をインプットする作業ならHaikuで充分ってことなんでしょうか。(本文をちゃんと読んでいない)
現在では全文を安価なLLMに前処理(要約やフィルター)させた後に読む仕様らしい。/configからverboseオンで挙動を確認できる。MDN等一部のサイトは例外として登録されている。