美聯社的資料庫週一停擺了五小時!只因為它們按下一個確認鍵...
文章分類: 產業新聞

根據美聯社自己的報導,它們的資料庫在這個週一發生了五個小時的停擺,導致這個事件的元兇是因為它們的工程師按下了一個確認鍵。重點是,這不是啥色情網站或者是奇怪軟體的安裝程式,而是多數安裝正版Windows系統的人會不加思索就按下去的Windows Update。
因為這個多半人不會猶豫的動作(重點是它是真正來自微軟發布的更新。),美聯社也嘗試把資料庫轉移到備份主機,不過徒勞無功,經過五個小時候,美聯社才搞定這樁烏龍事件。當然其中的影響也相當的大,包括許多使用美聯社網路資料庫的國際媒體,都受到這次美聯社主機停擺的影響。
這到底算是美聯社資料庫的程式有了問題,或是因為Windows Update造成的因素?目前美聯社沒有後續的報導,不過這也顯示對於大型企業而言,天算果然不如人算,人算也比不過一次偶然的機會按下確認鍵...當然這件事情並不一定是哪方面的絕對錯誤,不過這顯示先進與數位化,並且擁有許多備份機制的現代傳媒,甚至大如美聯社,還是會遭遇偶發事件的衝擊。




讀者回應 (第 1 頁 / 共 1 頁)
RL @ Oct 29th 2010 10:38AM
來台灣採訪後被賽到?
陳小白 @ Oct 27th 2010 12:41AM
泰彌亞在你的未來預見了[資料庫無法啟動] 1/1
成就一覽 [不用微軟的產品必須死] [您可能已經成為微軟軟體的受害者]
Cyanvit @ Oct 26th 2010 11:26PM
沒事不要去update server,這也算是網管的常識。只有安全性更新才值得「冒險」更新的。。。 囧
Hikaru Chang @ Oct 26th 2010 11:52PM
安全性更新是必要的
但如果用冒險的話也太兩光了吧哈哈
一不小心就準備回家吃自已了
所以正確的觀念還是要有個「完善的更新流程」
平常的「回復測試演練」也是很重要的
畢竟建構在大量的資訊科技下
資訊人員搞的不僅是幾台server,也可能是半個公司
Jesse Wang @ Oct 26th 2010 11:30PM
的確是,Server 上的 Windows Update 別亂按,按下去就掛了是有前例可循的。
tyf @ Oct 26th 2010 11:34PM
像這種伺服主機,我都用虛擬機器來跑,比較有彈性.
隨時可以備份整顆硬碟,隨時可以切掉還原.
只要記憶體插多一點就行了.
hwaselin @ Oct 26th 2010 11:40PM
這是目前大多數windows伺服主機的狀況,微軟的更新只是負責自己OS的漏洞所做的修補,
疏不知某些修補會更改到底層部份元件的使用權限,導致原本使用該元件開發的系統,
突然間變成存取權限發生問題,而停滯甚至當機。
最討厭的是微軟的修補只是表面簡單的說:更新系統安全等等的廢話,卻完全不提及被更新的元件或是類別名稱
導致系統開發工程師頻頻為了windows修補造成的無法使用尋找原因而疲於奔命。
我任職的公司過去就曾經發生過WEB主機做了windows updates以後該WEB服務因此啟動不了的窘境。
直到現在windows伺服器若要做updates都得小心的一項項作。每次updates又非常的多,真是相當痛苦。
Vinix @ Oct 27th 2010 12:35AM
恩...其實是有的,每一個更新都有寫更新了哪些檔案,只是要連到線上去找。
範例:(請往下翻)
http://support.microsoft.com/?kbid=981957
lamttl @ Oct 28th 2010 1:37AM
我想起以前有一幅漫畫,內容是這樣的:
一個工程師用電腦計 "1除0" ,結果那部電腦冒煙著火。
另一個在旁的工程師若無其事地說了一句: "Should be running Microsoft's Code."
註: 任何數除0 在數學上都沒有解。
guest @ Oct 27th 2010 1:28AM
任何數除0的答案都是0,保證有解,
至於"除0"和"除以0"的差別小學老師應該都有教過.
kuopi @ Oct 27th 2010 1:41AM
不懂樓上在說甚麼Orz
lustuser01 @ Oct 27th 2010 2:05AM
only 0/0 =0
http://en.wikipedia.org/wiki/Division_by_zero
ph0923 @ Oct 27th 2010 2:22AM
除數 (分母),被除數 (分子)
5除6 = 6/5 = 5除以6
n除0 = 0/n = 0除以n
國小的數學大約有10%是在教國文
像是此例的除數與被除數,還有以上、不超過這些...
ph0923 @ Oct 27th 2010 2:24AM
打太快,那個 "5除以6" 要改成 "6除以5" 才對
francis @ Oct 27th 2010 2:28AM
這麼重要的機器不會先測過再apply update啊?
又... 原來0/0=0啊.
noone @ Oct 27th 2010 3:33AM
十除五:5÷10=0.5 十個人去平分五顆蘋果,每人得幾顆 答:每人得半顆
十除以五:10÷5=2 十顆蘋果平分給五個人,每人得幾顆 答:每人得兩顆
十除零:0÷10=0 十個人去平分零顆蘋果,每人得幾顆 答:每人得零顆
十除以零:10÷0=無意義 十顆蘋果平分給零個人,每人得幾顆 答:問題在實數下不成立,既然沒有拿蘋果的人,那麼哪來的每個人
Jay @ Oct 27th 2010 7:08AM
1.沒有備援機即時自動頂上去,失敗。
說明資料庫平時是單機運作的,沒有同步的備援機在一旁待命。
這麼大一間公司,如果資料庫掛點會損失很大,那麼這個 MIS 是不合格的
良好的網站用盡一切辦法,使的上線率達到 99.9%,年停機時間小於5分鐘
方法包括:即時同步的備援機,叢集運算(雲端運算),甚至異地即時同步
機房被炸了都不會停機,除非兩地機房同時被炸...
2.按 update 不是錯,錯的是用了 $牌的系統當伺服器,失敗中的失敗。
工程師挑產品的眼光有問題。
強調 Enterprise 企業發行版,穩定的 unix-lkie 系統
沒有任何一套會在更新後當機的,聞所未聞
更新會當掉,那絕不是常識,是品質有問題
不過這位(或這群 MIS)雖然實力差
但社會工程是厲害的,懂的用 M牌的缺失來脫罪 XD
用 $牌的好處,大概就是出事,可以拿來頂罪吧,把無能和過錯全部推給它....
MDGSC @ Oct 27th 2010 9:30AM
這整篇我只有一個不大認同的地方
就是……伺服器用什麼作業系統往往不是MIS能決定的
lamttl @ Oct 28th 2010 2:53AM
工程師挑產品的眼光有問題