亞太日報 | 全球著名網站集體宕機,原因令人大跌眼鏡

亞太日報

text

亞太日報 沃克

本週二一大早,全球大量網站突遇斷線故障,包括新聞網站《紐約時報》、“BBC”和“CNN”、購物軟件亞馬遜和“eBay”、英國政府官網、音樂軟件“Spotify”、社交軟件“Pinterest”和“Reddit”、遊戲影音軟件“Twitch”在內的衆多平臺一時間都出現了無法訪問的問題。

馬上,來自美國雲端運算服務商“Fastly”公司的調查人員開始尋找故障發生的原因。“我們在1分鐘內就檢測到了網絡中斷的問題,”該公司的工程和基礎設施高級副總裁尼克·洛克威爾在博客文章中寫道。

然而,最終的調查結果卻令人難以置信——觸發本次大規模斷網事件的根源,竟然只是Fastly平臺上一個未命名用戶的操作。原來,Fastly公司在5月中旬曾進行了一項軟件部署工作,其中存在一個特定情況下將被觸發的錯誤,只是這個漏洞一直處於休眠狀態,直到本月8日,一名客戶提出了一個“有效配置更改”的請求,無意中觸發了該漏洞,導致該公司85%的服務器都出現了網絡返回錯誤。

00170ea1-500.jpg

人們抱怨道,他們點開這些網站的客戶端後,只能看到頁面顯示“503錯誤”的狀態碼。那麼,“503錯誤”是什麼意思?科技新聞網站“CNET”稱,“這個錯誤的通常原因包括兩種:一是託管該網站的服務器進行了停機維護,二是網站過載,比如有太多人同時訪問它。如果您看到網頁出現這個代號,意味着託管該網站的服務器尚未準備好處理您的訪問請求。不過,這個代號也說明問題只是暫時的,應該很快就能被解決。”據悉,CNET網站在8日也遭遇了斷線故障。

“事件發生49分鐘後,經過我們的修復工作,95%的網站都恢復了正常,”洛克威爾寫道,“這次網絡斷線的規模很廣泛,我們真的很抱歉。”

但是,爲什麼Fastly公司的一個失誤會讓如此多的網站都受到牽連?對此,CNET稱,Fastly公司的服務對於很多網站來說都是必不可少的,而能夠提供這些服務的公司並不多,因此,大量網站不得不依賴於極少數公司,以維持運營。此前,類似的事故也曾多次發生,例如,去年7月,全球內容傳遞網絡CDN加速服務商“Cloudflare”公司就曾出現故障,導致許多網站斷線,訪問時出現“502錯誤”代號。

接着,有人可能會問,類似的技術故障在未來還會出現嗎?爲了確保歷史不再重演,Fastly公司表示,他們目前除了修復錯誤,還在仔細回顧5月的軟件部署操作,試圖弄清楚爲什麼當初沒有在測試過程中就發現錯誤。此外,該公司還在試圖提高修復該類故障所需的時間。

(來源:亞太日報 APD News)