テクノロジー

長いページは全体がクロールされなくなる? Googleがクロール制限を15MB→2MBに縮小【やじうまWatch】

1: ryou-takano 2026/02/09 17:28

慌ててSearch ConsoleのURL検査でインデックス登録されたHTMLを確認してみたけど、とりあえず最近書いた中では最長(WordPressのCMSで3万1754字とカウントされている)の記事でも最後まで保存されてたからとくに問題はなさそう。

2: nguyen-oi 2026/02/09 17:30

Google様が2MBと言ったら2MBなんだよ。長文SEOの時代が終わるだけ

3: inmysoul 2026/02/09 17:32

うっかり広告のコード分もカウントしちゃって、クソサイトが蒸発すればいいのにな。

4: urtz 2026/02/09 17:42

wikipediaのページは、たしか数MBのものがそこそこあると思う。

5: nakex1 2026/02/09 17:56

2MBって1バイト文字(英数字)で約200万文字分って理解であってる?もしそうなら,HTMLのタグもカウントしたり,漢字や絵文字など数バイト使う文字で書いてても相当長い記事でないと達しないような気がするが。

6: red_tanuki 2026/02/09 18:06

patoさんのページがひっかかるかな…

7: Habatsuka 2026/02/09 18:33

パッと思いつくのは、生成AIのなんらかの出力への対応とか? 一般的なユースケースだと該当することはほとんどないのだと思いたいけど。

8: aga_aga 2026/02/09 18:36

そもそも検索文化も廃れてるんだからクロールやめてグーグル検索もやめちゃえば?

9: ShionAmasato 2026/02/09 18:42

もしも全文が3バイト文字(普通はあり得ない)でも2MiB近くに達するには69万文字超が必要で、掛かるケースが思いつかない。既出コメのように自動生成コンテンツ対策な気はする

10: Cherenkov 2026/02/09 19:31

クロールバジェットとかどうなるんや

11: richmikan 2026/02/09 19:37

小刻みにページ化されている方が正義というのか。長いページの方がページ内検索がやりやすいのだが。1ページの長さだけじゃなくて、ページ数も制限かけないと何度もページをめくらせるゴミみたいなWebページが増える

12: kenjou 2026/02/09 21:30

生成AIでやたらと長く、それでいて無駄な情報ばかりのページが作られていてその対策とかなのかな。

13: ooblog 2026/02/09 21:39

#Google #SEO 「2MB以降に書かれた内容は事実上無視される~ひとつのページにまとめてきたウェブサイトにとっては痛手」稀にプログラミング備忘録の類クソデカペライチ1発ロードでローカル検索させる脳筋スタイル有る気が。

14: flirt774 2026/02/09 22:26

画像を除くリソースの制限なので、コアウェブバイタルが影響してそう。リソースが15MBとかだとFCP始め相当スコア悪く離脱するし(待てない)、評価するまでもないだろうという判断かも

15: u_mid 2026/02/09 22:31

確かにと思ってpatoさんの記事のhtmlをDLしてみたら https://travel.spot-app.jp/jimoto_frappuccino/ で本文9万字で597KB。9万字でもUTF-8で270KBくらいか/noteだとタグやら何やらでhtmlが膨れ上がるっぽいので長い記事だと2MB超えるかも

16: yorkfield 2026/02/09 22:43

無駄なページ切り替えが増える?と思ったけど、HTMLで2MB越えはそうそうないか。Wikipediaの長いページはHTMLとしては3MBくらいだった。 https://ja.wikipedia.org/wiki/%E7%89%B9%E5%88%A5:%E9%95%B7%E3%81%84%E3%83%9A%E3%83%BC%E3%82%B8

17: snow8-yuki 2026/02/09 23:18

テキストのみ2MiBはまずないから一体どれだけ影響すんのかって感じ

18: fallout1999 2026/02/09 23:24

検索避けに2MB意味の無い文章載せた後にエッチな小説書けば大丈夫になるのかな

19: nakatamabashi 2026/02/09 23:27

金があるときに作りこんでみたものの大掛かりな改修をしないまま何年も経過して、部分的(ヘッダ/フッタ)のリニューアルばっかり繰り返したことでレガシーコードが散在している大規模サイトは全滅だね

20: nakag0711 2026/02/09 23:28

Google、LLM時代についに検索事業の縮小を開始

21: kijtra 2026/02/09 23:46

本文というよりネストしまくって波動拳になったHTMLとか複雑にしすぎるのが良くなさそうな感じする

22: adsty 2026/02/09 23:53

2MB以降に書かれた内容は事実上無視されることになる。

23: MarvinParnroid 2026/02/10 00:32

元ツイ見ると分かるが、単に今まで公式ページの記載が間違ってただけっぽいね。要するに、この件で何の影響も無いってこと。

24: arisazai 2026/02/10 00:55

patoさんの記事いくつか見たけどどれも数百KBだったから2MBって本当によっぽどだと思う

25: getcha 2026/02/10 02:40

コスト削減

26: arjen__robben 2026/02/10 07:14

いわゆる「本文」の影響はほんの僅かで、CSSやSVGのインライン化やメタデータ埋め込みとかしてるとHTMLは膨れ上がる。それでも2MB超えることは稀だと思うけど。

27: I8D 2026/02/10 07:16

謝罪ページの冒頭に2MB分を配置するのが流行りそう。

28: tym1101 2026/02/10 07:35

1ファイルごとならそこまで厳しくはないか

29: zoidstown 2026/02/10 08:38

細切れサイトは見にくくてやだなぁ。“なるべくページを区切らずにドキュメントをひとつのページにまとめてきたウェブサイトにとっては痛手で、サイトの作り方が根本的に変わってくる可能性もある。”

30: miki3k 2026/02/10 08:45

htmlファイルの単体サイズで2MBは、あまり困らない気がするが

31: strawberryhunter 2026/02/10 11:20

自動生成コンテンツ対策ではなくて、Googleの検索エンジン関連のAIのコンテキストに収まるように制限するのではないかと思う。

32: secseek 2026/02/10 14:14

全体じゃなくてHTML単品なら確かにそんなもんかと思います。ちなみに僕のブックマークを27000件ほど並べたページが4.1MBくらいでした