テクノロジー

Google Cloud、世界中のリージョンが影響を受けた大規模障害、原因は管理システムがヌルポインタ参照でクラッシュしたこと

1: sasasin_net 2025/06/16 00:06

ガッ

2: err931 2025/06/16 00:13

ぬるぽ

3: ardarim 2025/06/16 00:21

AIの時代になってもぬるぽは起きる

4: nmcli 2025/06/16 01:02

( ´∀`)

5: ko2inte8cu 2025/06/16 01:03

新機能はバグを連れてくる

6: hatebu_admin 2025/06/16 02:32

ぬるぽしにきました

7: boxshiitake 2025/06/16 03:29

Googleもヌルポするんか

8: turu_crane 2025/06/16 03:33

ぬるぽ……>バグは、ヌルポインタを参照するとクラッシュするというものでした

9: m7g6s 2025/06/16 04:41

ぬるぽしたからガッしたのか

10: hogetax 2025/06/16 05:19

原因はともかく、対応が早いな。運用監視やログシステムと人がうまく動いてるんだろうな

11: bopperjp 2025/06/16 05:36

検出と復旧の早さがワールドクラスサービス。SRE が超絶優秀。こういうレアケースのために大金払ってる人員がいるのかなぁ。

12: septoot 2025/06/16 06:20

そもそもシステムを24時間動かすっていうのが無理なんだよ

13: kamei_rio 2025/06/16 07:09

2分で検知、10分で原因特定、25分で緊急ボタンポチー

14: diveintounlimit 2025/06/16 07:17

ぬるぽ

15: aomvce 2025/06/16 07:32

Azureかよ

16: unmarshal 2025/06/16 07:34

“ヌルポ”

17: lenore 2025/06/16 07:41

日本時間の深夜でよかった。米国深夜でも同じスピード対応になるか

18: snare_micchan 2025/06/16 07:49

これがNTTデータの勘定系とかだったら、同じ対応速度でも「対応が早い」とは絶対に言われず「これだから日本のITはダメなんだ」と言われるんだろうな

19: taiyow 2025/06/16 08:11

緊急巻き戻しが11時30分に終わってるのに、リージョン復旧は早くて12:30、us-central-1 ではさらに2時間かかったのか。今後も同様と考えるとus-central-1は避けた方が良く無い?

20: riawiththesam 2025/06/16 08:43

ガッ

21: kagehiens 2025/06/16 09:00

規模を考えると復旧までが早いのは分かるけど、発生の経緯や影響範囲のデカさは褒められたもんじゃないよな。

22: taguch1 2025/06/16 09:09

ガッ

23: tor4kichi 2025/06/16 09:09

null安全に振り切らないから事故る。null参照チェック忘れはコンパイルエラーにして弾かないとだし、その上でnull安全を実現するだけのグルーコードを如何に減らすか。言語設計のコンセプトが問われる。

24: Falky 2025/06/16 09:11

10分で原因特定、40分でロールバックまで完了したらどこのシステムだろうが対応が遅いなんて言わないだろ…。もし言う奴がいたら素人だから無視しとけよ//しかし原因がなかなかにお粗末だな…。

25: iasna 2025/06/16 09:22

こまけぇことはわかんないけどヌルポをガッしたことだけはわかる

26: labor9 2025/06/16 09:24

AIによる永続的なコード巡回、自動修正の時代が来るな これで精度向上してもらえればありがたい

27: azumi_s 2025/06/16 09:25

ガッ!

28: tamanecoplus 2025/06/16 09:31

ヌルポは結果であって原因ではない定期

29: IGA-OS 2025/06/16 09:50

対応早い

30: delphinus35 2025/06/16 10:08

Googleレベルでもぬるぽで死ぬし「多分動くと思うからリリースしようぜ」をやっちゃうのか……/us-central-1、グローバルに展開するサービスだとだいたいここ使うけど、今回のようなことあるならやめた方がいいのか。

31: ite 2025/06/16 10:12

ヌルポから25分でガッできたのか。

32: suka6411144 2025/06/16 10:15

null安全の言語のありがたみがよくわかる

33: honeybe 2025/06/16 10:51

ガッ! / Service Helth 情報を個人slackで見てたからなんかあったのだけは察していた。

34: getcha 2025/06/16 11:26

対応早いし原因もはっきりしているな。とも言えるが、逆に原因のレベルが低すぎて(まともなテストしてない?)レベルだったので、10分以内に原因がすぐにわかった。とも言えそうな...すごい雑そうなリリースプロセス。

35: otihateten3510 2025/06/16 11:27

Googleでもぬるぽで落ちるのに、弱小チームでもぬるぽで落ちたら詰められるんだよね。Xcodeなんてしょっちゅうクラッシュしてるんだが。

36: sny22015 2025/06/16 11:30

ガッ

37: lbtmplz 2025/06/16 11:48

中の人の対応時の映像がイノセンスで再生される

38: dslvan 2025/06/16 12:03

“原因となる新ポリシーの適用を巻き戻す「緊急ボタン(Red Button)」を実行。この緊急ボタン機能は、幸いにも追加機能の中に実装されていたものです。”ラッキーなのかアンラッキーなのか…

39: localnavi 2025/06/16 12:05

これがあれか、かの有名な「ぬるぽ」「ガッ」か。いやいや、長生きはするものだなあ

40: Caligari 2025/06/16 12:23

ガッしろ

41: naka-06_18 2025/06/16 12:29

カナリアリリースとかあるはずなのに