別人的宕機時間是AWS的七倍,aws云主機時快時慢怎么處理-ESG跨境

別人的宕機時間是AWS的七倍,aws云主機時快時慢怎么處理

來源網(wǎng)絡(luò)
來源網(wǎng)絡(luò)
2022-07-05
點贊icon 0
查看icon 733

別人的宕機時間是AWS的七倍,aws云主機時快時慢怎么處理別人的宕機時間是AWS的七倍北京時間2020年12月14日晚間,由于內(nèi)部技術(shù)故障導(dǎo)致大面積宕機,谷歌多項服務(wù)均無法提供服務(wù),類似的宕機新聞時有發(fā)生,每次的主角都可能都不一樣,到底誰的宕機次數(shù)和宕機時間更少呢市面上有一些公開的監(jiān)測數(shù)據(jù),比如來自downdetect......

別人的宕機時間是AWS的七倍,aws云主機時快時慢怎么處理




別人的宕機時間是AWS的七倍

北京時間2020年12月14日晚間,由于內(nèi)部技術(shù)故障導(dǎo)致大面積宕機,谷歌多項服務(wù)均無法提供服務(wù),類似的宕機新聞時有發(fā)生,每次的主角都可能都不一樣,到底誰的宕機次數(shù)和宕機時間更少呢

市面上有一些公開的監(jiān)測數(shù)據(jù),比如來自downdetector.com和cloudharmony.com的數(shù)據(jù),也有廠商比較自豪說自己宕機時間比同行老伙計時間短的,比如在2018年,亞馬遜云服務(wù)(AWS)表示第二大云計算公司的宕機時間是AWS的7倍。

AWS坐擁全球近一半的云市場份額,理論上規(guī)模越大越容易出錯才對,AWS為了減少宕機時間都做了什么呢

在亞馬遜re:Invent大會,AWS全球基礎(chǔ)架構(gòu)和客戶支持高級副總裁Peter DeSantis介紹了基礎(chǔ)設(shè)施層面上方方面面的創(chuàng)新,包括如何減少宕機,如何降本增效等等。

在減少宕機時間,在提升服務(wù)連續(xù)性方面,AWS有挺多的有意義的做法,AWS大中華區(qū)產(chǎn)品部計算與存儲總監(jiān)周舸向中國媒體介紹了其中幾點。

AWS數(shù)據(jù)中心電力冗余設(shè)計簡介

發(fā)電機組

從電力供應(yīng)開始說起,周舸介紹了柴油發(fā)電機,介紹了配電室(Ehouse),UPS備用電源等方面。

Ehouse

令人印象深刻的是,為了減少可能發(fā)生的故障,AWS在采用現(xiàn)有商用方案(一般是嵌入式系統(tǒng))的基礎(chǔ)上,舍棄了許多原有的東西,自己設(shè)計了控制電路的代碼。

AWS對基礎(chǔ)架構(gòu)的控制能力可見一斑。

原裝設(shè)備控制電路存在的問題

在AWS看來,這些控制軟件有可能有Bug,如果Bug發(fā)生,廠商無法在短時間內(nèi)完成修復(fù),而如果這些軟件本身就是自己寫的,那么就可以很快進行修復(fù)。這種對于現(xiàn)有服務(wù)方案的“不信任”貫穿著AWS架構(gòu)設(shè)計的方方面面。

AWS CTO Werner Vogels曾說過,”Everything fails,all the time”,也就是說,所有東西都可能會壞掉,既然無法避免會壞掉,那就坦然接受,但一定要盡量減少壞掉造成的影響,要能預(yù)測什么時候會壞、怎么壞的,提前做出防范和應(yīng)對。

比如,為了保障電力供應(yīng),AWS會在有外部電網(wǎng)供電和內(nèi)部發(fā)電機組的基礎(chǔ)上,再加一組發(fā)電機,采用冗余的供電方式,冗余設(shè)計是貫穿整體架構(gòu)設(shè)計的方方面面,但這會大大提升復(fù)雜度,越復(fù)雜就越危險。

在2020 re:Invent大會上,Peter DeSantis張貼了這樣一張圖,橫軸表示系統(tǒng)復(fù)雜度,縱軸表示故障造成的傷害(爆炸半徑),原本的Switch Gear(配電控制系統(tǒng))和UPS系統(tǒng)處在較為危險的位置。

在Switch Gear(配電控制系統(tǒng))系統(tǒng)的優(yōu)化改造中,AWS通過自己寫軟件控制系統(tǒng),刪除一些沒用的、添加部分對AWS有用的功能后,降低了系統(tǒng)復(fù)雜度,提升了系統(tǒng)的可靠性和安全性。

使用Rack Level小電池塊的UPS

在UPS系統(tǒng)改造中,除了軟件層的改進,還使用小容量(Rack Level電池)的電池,而不是以前超大容量的電池,從而降低電池爆炸造成的傷害,從而遠離了爆炸半徑。

AWS數(shù)據(jù)中心級別的高可用設(shè)計簡介

2000年左右,那是一個還沒有AWS的時代,Amazon在美國西雅圖有一個數(shù)據(jù)中心,隨著業(yè)務(wù)規(guī)模的擴大,亞馬遜開始意識到海嘯和地震的潛在風(fēng)險,不能把所有東西都放這里,于是就想在沒有地震海嘯威脅的美國東海岸建一個數(shù)據(jù)中心。

東西海岸70ms的超高延遲是絕對不能接受的

各種自然災(zāi)害的影響范圍與距離造成的延遲

兩個數(shù)據(jù)中心放的太近,可能遭受同一個自然災(zāi)害的侵襲,如果離得太遠,延遲會帶來數(shù)據(jù)同步的問題也同樣不可接受,美國東西海岸的距離就會造成這一問題。所以,數(shù)據(jù)中心之間需要保持一定的安全距離,而且要保證一毫秒以內(nèi)的延遲。

類似的,AWS強調(diào)多AZ(Avaibable Zone)與多機房的概念不一樣,AWS每個Region有至少三個AZ,AWS認為多個AZ相互間要有一定的安全距離,以此來降低外部環(huán)境同時對多個AZ造成影響,來提升服務(wù)的可用性。

從Region的角度看,AWS為了減少Region間可能造成的干擾,設(shè)計原則上是將各個Region獨立運作,一個Region出的問題不會傳遞到別的Region,在Region的級別提供冗余。

AWS供應(yīng)鏈保障

2020年是黑天鵝滿天飛的一年,突如其來的疫情,急劇增長的在線業(yè)務(wù)量,逼著所有云廠商在加班加點忙著擴容資源,AWS也不例外,就AWS的規(guī)模來猜測,擴容規(guī)模要遠大于大部分云廠商。

2015年,AWS供應(yīng)鏈概況

為了保障擴容的順利進行,AWS在供應(yīng)鏈采購管理上采取了多元化策略,供應(yīng)商的數(shù)量,供應(yīng)商覆蓋的國家和地區(qū)在數(shù)量上有了很大提升。如今,AWS的供應(yīng)鏈系統(tǒng)覆蓋7個國家,86家供應(yīng)商,以此來暴漲供應(yīng)鏈的穩(wěn)定。

2020年,AWS供應(yīng)鏈概況

在疫情在全球爆發(fā)的2020年,多元化管理策略確實挺有價值,疫情的不確定性給供應(yīng)鏈帶來很大挑戰(zhàn),許多國家的生產(chǎn)環(huán)節(jié)和清關(guān)效率都出了很大問題,對此,周舸表示深有體會。

寫在最后

在可用性方面,公有云作為公開可見的服務(wù),更容易受到公眾關(guān)注,造成公有云更容易出故障的印象。

拋開客觀感受不說,由于公有云作為一種服務(wù),而不是一個個onpremise產(chǎn)品盒子,要考慮的內(nèi)容更多一些,比如供電,比如網(wǎng)絡(luò),比如運營能力等,確實非常考驗云廠商的綜合實力,需要有數(shù)不清的技術(shù)創(chuàng)新來打造更高的可用性和業(yè)務(wù)連續(xù)性。

隨著一步步迭代和發(fā)展,技術(shù)只會更成熟,運營經(jīng)驗會更豐富。


文章推薦
Wish平臺怎么屏蔽部分國家的物流
Unity Ads如何復(fù)制已經(jīng)存在的項目,unity ads 屬于什么平臺
避免5個不良的谷歌SEO內(nèi)容策略,谷歌seo分析案例
阿里云服務(wù)器FTP設(shè)置,阿里云服務(wù)器ftp設(shè)置公網(wǎng)地址


特別聲明:以上文章內(nèi)容僅代表作者本人觀點,不代表ESG跨境電商觀點或立場。如有關(guān)于作品內(nèi)容、版權(quán)或其它問題請于作品發(fā)表后的30日內(nèi)與ESG跨境電商聯(lián)系。

搜索 放大鏡
韓國平臺交流群
加入
韓國平臺交流群
掃碼進群
歐洲多平臺交流群
加入
歐洲多平臺交流群
掃碼進群
美國賣家交流群
加入
美國賣家交流群
掃碼進群
ESG跨境專屬福利分享群
加入
ESG跨境專屬福利分享群
掃碼進群
拉美電商交流群
加入
拉美電商交流群
掃碼進群
亞馬遜跨境增長交流群
加入
亞馬遜跨境增長交流群
掃碼進群
亞馬遜跨境增長交流群
加入
亞馬遜跨境增長交流群
掃碼進群
拉美電商交流群
加入
拉美電商交流群
掃碼進群
ESG獨家招商-PHH GROUP賣家交流群
加入
ESG獨家招商-PHH GROUP賣家交流群
掃碼進群
《Darty知識百科》
《法國Fnac知識百科》
2025跨境電商營銷日歷
《2024年全球消費趨勢白皮書——美國篇》
《2024TikTok出海達人營銷白皮書》
《Coupang自注冊指南》
《eMAG知識百科》
《TikTok官方運營干貨合集》
《韓國節(jié)日營銷指南》
《開店大全-全球合集》
通過ESG入駐平臺,您將解鎖
綠色通道,更高的入駐成功率
專業(yè)1v1客戶經(jīng)理服務(wù)
運營實操指導(dǎo)
運營提效資源福利
平臺官方專屬優(yōu)惠

立即登記,定期獲得更多資訊

訂閱
聯(lián)系顧問

平臺顧問

平臺顧問 平臺顧問

微信掃一掃
馬上聯(lián)系在線顧問

icon icon

小程序

微信小程序

ESG跨境小程序
手機入駐更便捷

icon icon

返回頂部