Facebook 系 app 數小時大當機的根源是主幹路由器配置出錯

Facebook、Messenger、Instagram、WhatsApp 總共花了近 7 小時才恢復正常。

NEW YORK, NY - OCTOBER 25: Facebook CEO Mark Zuckerberg pauses while speaking about the new Facebook News feature at the Paley Center For Media on October 25, 2019 in New York City. Facebook News, which will appear in a new dedicated section on the Facebook app, will offer stories from a mix of publications, including The New York Times, The Wall Street Journal and The Washington Post, as well as other digital-only outlets.(Photo by Drew Angerer/Getty Images)

從昨日晚間約 11 時起,Facebook 及旗下的 Messenger、Instagram、WhatsApp、Oculus 等服務開始在全球範圍內出現了大規模的使用問題。直到今天早晨,這些 app 才終於陸續恢復上線。在近 7 個小時的搶修過程中,Facebook 公司內部也遭遇了電郵、Workplace 等企業工具無法打開等困境。甚至連伺服器機房的門卡系統也在受災之列,據傳維修人員不得不動用切割機才得以進入伺服器安全籠。

在大當機期間,有不少安全專家都推測問題的根源可能是邊界網關協議(Border Gateway Protocol)。而在後續的官方聲明中,Facebook 的工程團隊這麼寫道:「我們已經發現是由於協調數據中心間網路流量的主幹路由器發生配置變化,才導致了通訊中斷,這種中斷對數據中心間的通訊造成了連帶影響,使我們的服務陷入了停頓。」與此同時,其也強調問題完全是因「配置出錯」所致,目前沒有任何用戶數據外洩的證據。

經此一事 Facebook 的股價不意外大幅下跌,CEO Mark Zuckerberg 的身價一下子縮水了數十億美元。不久前才剛有前員工跳出來指責 Facebook 只會「置利益於安全之上」,這下再加上大當機帶來的負面影響,Zuckerberg 近期還真是焦頭爛額呢...