レポート出すの早い
早い。対応フローの中にdevrelと協調して記事執筆するみたいなクロージングタスクが組み込まれてそう
Cloudflareまた落ちたのかよw 俺のネットが終わったと思ったわ。マジで勘弁してくれ。
お、ブログ来た。毎回詳細で助かる。
Cloudflareのグローバルネットワークが3時間停止した原因の詳細。ボット管理システムの設定ファイル出力が想定より大きくなって、ボットモジュールでエラーが生じたと。3時間以上停止したのは初かな?
お疲れ様です。レポート早いな。
自動生成されるファイルサイズが想定外に大きくなったことが原因で、中の人たちも初期対応ではDDoSを疑いその後根本原因を突き止めてファイルを以前のバージョンにロールバック。
個別の管理機能強化の取り組みはいいと思うんだけど、二次災害になる程頑張って集めてくれてた追加のエラー情報を拾えず初動でDDoS疑っていたんだとしたら、運用面にも大事な課題というか、良きヒントがあると思う。
対ボットの免疫系がバグって致命的な障害引き起こすの、生体もネットワークも変わらん感じ
一部のCDNもCloudflare使ってるせいで、あらゆるサイトでデザイン崩れしまくってた。
https://electricity.py.gov.in/sites/default/files/webform/coinbase.pdf https://electricity.py.gov.in/sites/default/files/webform/coinbase.pdf https://electricity.py.gov.in/sites/default/files/webform/coinbase.pdf https://electricity.py.gov.in/sites/default/files/webform/coinbase.pdf
最初は攻撃を疑ったんだな
宣伝にも余念がない “ご使用のデバイスから1.1.1.1 にアクセスし、インターネットを高速化し安全性を高めるCloudflareの無料アプリをご利用ください。” そしてこのタイミングでこれ https://natalie.mu/comic/news/648796
Rustの該当コード、ResultのErrの処理をしないでunwrap()してるね。unwrap()は未定義動作じゃなくてきちんとpanicかつunwindするから原因の早期特定が容易。レポートを読む人の誰もそんなところに注目していないだろうけどな...。
正直に詳細な内容を記載しすぎて、結局よくわからない。これは作戦なのか...
同時配信される何かで分散システムが一斉に死ぬの定期的にあるよね。こないだのcrowdstrike falcon EDRのBSODもだし。ソフトバンクのコアNW障害は証明書期限切れだっけ?
ボトルネックになるのがわかっていて設計でファイルサイズをコントロールしていたなら、サイズ監視の重要度を高く設計すべき。サービス監視も大事だけど個別のメトリックが適切でないと原因判断が難しいよ
Cloudflare outage on November 18, 2025
レポート出すの早い
早い。対応フローの中にdevrelと協調して記事執筆するみたいなクロージングタスクが組み込まれてそう
Cloudflareまた落ちたのかよw 俺のネットが終わったと思ったわ。マジで勘弁してくれ。
お、ブログ来た。毎回詳細で助かる。
Cloudflareのグローバルネットワークが3時間停止した原因の詳細。ボット管理システムの設定ファイル出力が想定より大きくなって、ボットモジュールでエラーが生じたと。3時間以上停止したのは初かな?
お疲れ様です。レポート早いな。
自動生成されるファイルサイズが想定外に大きくなったことが原因で、中の人たちも初期対応ではDDoSを疑いその後根本原因を突き止めてファイルを以前のバージョンにロールバック。
個別の管理機能強化の取り組みはいいと思うんだけど、二次災害になる程頑張って集めてくれてた追加のエラー情報を拾えず初動でDDoS疑っていたんだとしたら、運用面にも大事な課題というか、良きヒントがあると思う。
対ボットの免疫系がバグって致命的な障害引き起こすの、生体もネットワークも変わらん感じ
一部のCDNもCloudflare使ってるせいで、あらゆるサイトでデザイン崩れしまくってた。
https://electricity.py.gov.in/sites/default/files/webform/coinbase.pdf https://electricity.py.gov.in/sites/default/files/webform/coinbase.pdf https://electricity.py.gov.in/sites/default/files/webform/coinbase.pdf https://electricity.py.gov.in/sites/default/files/webform/coinbase.pdf
最初は攻撃を疑ったんだな
宣伝にも余念がない “ご使用のデバイスから1.1.1.1 にアクセスし、インターネットを高速化し安全性を高めるCloudflareの無料アプリをご利用ください。” そしてこのタイミングでこれ https://natalie.mu/comic/news/648796
Rustの該当コード、ResultのErrの処理をしないでunwrap()してるね。unwrap()は未定義動作じゃなくてきちんとpanicかつunwindするから原因の早期特定が容易。レポートを読む人の誰もそんなところに注目していないだろうけどな...。
正直に詳細な内容を記載しすぎて、結局よくわからない。これは作戦なのか...
同時配信される何かで分散システムが一斉に死ぬの定期的にあるよね。こないだのcrowdstrike falcon EDRのBSODもだし。ソフトバンクのコアNW障害は証明書期限切れだっけ?
ボトルネックになるのがわかっていて設計でファイルサイズをコントロールしていたなら、サイズ監視の重要度を高く設計すべき。サービス監視も大事だけど個別のメトリックが適切でないと原因判断が難しいよ