ガッ
ぬるぽ
AIの時代になってもぬるぽは起きる
( ´∀`)
新機能はバグを連れてくる
ぬるぽしにきました
Googleもヌルポするんか
ぬるぽ……>バグは、ヌルポインタを参照するとクラッシュするというものでした
ぬるぽしたからガッしたのか
原因はともかく、対応が早いな。運用監視やログシステムと人がうまく動いてるんだろうな
検出と復旧の早さがワールドクラスサービス。SRE が超絶優秀。こういうレアケースのために大金払ってる人員がいるのかなぁ。
そもそもシステムを24時間動かすっていうのが無理なんだよ
2分で検知、10分で原因特定、25分で緊急ボタンポチー
Azureかよ
“ヌルポ”
日本時間の深夜でよかった。米国深夜でも同じスピード対応になるか
これがNTTデータの勘定系とかだったら、同じ対応速度でも「対応が早い」とは絶対に言われず「これだから日本のITはダメなんだ」と言われるんだろうな
緊急巻き戻しが11時30分に終わってるのに、リージョン復旧は早くて12:30、us-central-1 ではさらに2時間かかったのか。今後も同様と考えるとus-central-1は避けた方が良く無い?
ガッ
規模を考えると復旧までが早いのは分かるけど、発生の経緯や影響範囲のデカさは褒められたもんじゃないよな。
null安全に振り切らないから事故る。null参照チェック忘れはコンパイルエラーにして弾かないとだし、その上でnull安全を実現するだけのグルーコードを如何に減らすか。言語設計のコンセプトが問われる。
10分で原因特定、40分でロールバックまで完了したらどこのシステムだろうが対応が遅いなんて言わないだろ…。もし言う奴がいたら素人だから無視しとけよ//しかし原因がなかなかにお粗末だな…。
こまけぇことはわかんないけどヌルポをガッしたことだけはわかる
AIによる永続的なコード巡回、自動修正の時代が来るな これで精度向上してもらえればありがたい
ガッ!
ヌルポは結果であって原因ではない定期
対応早い
Googleレベルでもぬるぽで死ぬし「多分動くと思うからリリースしようぜ」をやっちゃうのか……/us-central-1、グローバルに展開するサービスだとだいたいここ使うけど、今回のようなことあるならやめた方がいいのか。
ヌルポから25分でガッできたのか。
null安全の言語のありがたみがよくわかる
ガッ! / Service Helth 情報を個人slackで見てたからなんかあったのだけは察していた。
対応早いし原因もはっきりしているな。とも言えるが、逆に原因のレベルが低すぎて(まともなテストしてない?)レベルだったので、10分以内に原因がすぐにわかった。とも言えそうな...すごい雑そうなリリースプロセス。
Googleでもぬるぽで落ちるのに、弱小チームでもぬるぽで落ちたら詰められるんだよね。Xcodeなんてしょっちゅうクラッシュしてるんだが。
中の人の対応時の映像がイノセンスで再生される
“原因となる新ポリシーの適用を巻き戻す「緊急ボタン(Red Button)」を実行。この緊急ボタン機能は、幸いにも追加機能の中に実装されていたものです。”ラッキーなのかアンラッキーなのか…
これがあれか、かの有名な「ぬるぽ」「ガッ」か。いやいや、長生きはするものだなあ
ガッしろ
カナリアリリースとかあるはずなのに
Google Cloud、世界中のリージョンが影響を受けた大規模障害、原因は管理システムがヌルポインタ参照でクラッシュしたこと
ガッ
ぬるぽ
AIの時代になってもぬるぽは起きる
( ´∀`)
新機能はバグを連れてくる
ぬるぽしにきました
Googleもヌルポするんか
ぬるぽ……>バグは、ヌルポインタを参照するとクラッシュするというものでした
ぬるぽしたからガッしたのか
原因はともかく、対応が早いな。運用監視やログシステムと人がうまく動いてるんだろうな
検出と復旧の早さがワールドクラスサービス。SRE が超絶優秀。こういうレアケースのために大金払ってる人員がいるのかなぁ。
そもそもシステムを24時間動かすっていうのが無理なんだよ
2分で検知、10分で原因特定、25分で緊急ボタンポチー
ぬるぽ
Azureかよ
“ヌルポ”
日本時間の深夜でよかった。米国深夜でも同じスピード対応になるか
これがNTTデータの勘定系とかだったら、同じ対応速度でも「対応が早い」とは絶対に言われず「これだから日本のITはダメなんだ」と言われるんだろうな
緊急巻き戻しが11時30分に終わってるのに、リージョン復旧は早くて12:30、us-central-1 ではさらに2時間かかったのか。今後も同様と考えるとus-central-1は避けた方が良く無い?
ガッ
規模を考えると復旧までが早いのは分かるけど、発生の経緯や影響範囲のデカさは褒められたもんじゃないよな。
ガッ
null安全に振り切らないから事故る。null参照チェック忘れはコンパイルエラーにして弾かないとだし、その上でnull安全を実現するだけのグルーコードを如何に減らすか。言語設計のコンセプトが問われる。
10分で原因特定、40分でロールバックまで完了したらどこのシステムだろうが対応が遅いなんて言わないだろ…。もし言う奴がいたら素人だから無視しとけよ//しかし原因がなかなかにお粗末だな…。
こまけぇことはわかんないけどヌルポをガッしたことだけはわかる
AIによる永続的なコード巡回、自動修正の時代が来るな これで精度向上してもらえればありがたい
ガッ!
ヌルポは結果であって原因ではない定期
対応早い
Googleレベルでもぬるぽで死ぬし「多分動くと思うからリリースしようぜ」をやっちゃうのか……/us-central-1、グローバルに展開するサービスだとだいたいここ使うけど、今回のようなことあるならやめた方がいいのか。
ヌルポから25分でガッできたのか。
null安全の言語のありがたみがよくわかる
ガッ! / Service Helth 情報を個人slackで見てたからなんかあったのだけは察していた。
対応早いし原因もはっきりしているな。とも言えるが、逆に原因のレベルが低すぎて(まともなテストしてない?)レベルだったので、10分以内に原因がすぐにわかった。とも言えそうな...すごい雑そうなリリースプロセス。
Googleでもぬるぽで落ちるのに、弱小チームでもぬるぽで落ちたら詰められるんだよね。Xcodeなんてしょっちゅうクラッシュしてるんだが。
ガッ
中の人の対応時の映像がイノセンスで再生される
“原因となる新ポリシーの適用を巻き戻す「緊急ボタン(Red Button)」を実行。この緊急ボタン機能は、幸いにも追加機能の中に実装されていたものです。”ラッキーなのかアンラッキーなのか…
これがあれか、かの有名な「ぬるぽ」「ガッ」か。いやいや、長生きはするものだなあ
ガッしろ
カナリアリリースとかあるはずなのに