IT之家6月4日消息 昨日,谷歌云出現宕機問題,影響了谷歌內部和外部的多項服務,導致美國東部地區網絡擁堵,涉及谷歌云、谷歌智能應用套件G Suite和YouTube等多項服務,對大量用戶造成影響。
谷歌隨后表示,所有因網絡擁堵受影響用戶的問題已經解決。谷歌將對故障原因展開調查,并提供相關調查報告。今日,Google官方博客解釋了事故原因。
谷歌指出,從本質上講,昨日的網絡中斷是因為服務器配置更改。適用于單一區域中的少數服務器,錯誤地應用于多個相鄰區域的大量服務器,進而導致這些區域停止使用一半以上的可用網絡容量。進出這些區域的網絡流量試圖適應剩余的網絡容量,導致了網絡擁堵。網絡系統成功 分流了過載流量,保留了對延遲敏感的流量,并丟棄了大部分對延遲不是很敏感的流量。
谷歌表示,谷歌的工程團隊在幾秒鐘內就發現了這個問題,但診斷和糾正的時間遠遠超過預期。收到警報后,谷歌工程團隊就迅速確定了故障原因,但網絡擁堵同樣降低了工程團隊恢復正確配置的能力,從而延長了停機時間。
事故期間,YouTube全球觀看次數下降了10%,Google云存儲的流量減少了30%,大約1%的Gmail活躍用戶帳戶出現了問題。