位置:編程技術網 > 產品設計 > 正文 >

揭秘 AWS 基礎架構底層運維和構建之道!

2020年12月18日 07:35來源:未知手機版

中國電信 網上營業廳,六年級下冊第三單元作文,船在亞丁灣


>

出品 | CSDN(ID:CSDNnews)

在去年的AWS re:Invent大會上,AWS全球基礎架構和客戶支持資深副總裁Peter DeSantis在主題演講中分享了AWS基礎網絡支撐高性能計算,以及讓傳統計算密集型應用更好地運用云共享性特性的秘訣;今年,他從運營的角度,延伸至半導體和數據中心可持續發展等領域,揭秘AWS在基礎架構底層運維和構建上的一些思考。

他的講話有哪些值得關注的地方?我們來做一下深度解讀。

穩定運營,如何做到?

Everything fails, all the time. ——Amazon CTO Werner Vogels

正如Werner所說,構建云的時候,任何環節都可能出現問題,不出問題幾乎不可能。

2018年,AWS在re:Invent上曾公布過過一個數據:與AWS規模最接近的另一家服務商,云服務的宕機時間是AWS的7倍多。當時就有人關注,AWS是如何做到支撐起巨大規模的云服務的同時,保持穩定、可靠的運營?Peter在今年的演講中就為大家進行了揭秘。

總的來說,從細節著手,是AWS支撐如此大規模且復雜的基礎架構,同時保持運營穩定可靠的秘訣。

供電

具體來講,首先是從供電層面保證穩定性。對于任何基礎設施,供電都是關鍵所在,包括數據中心。一般從電網拿到電后,AWS經過Switch Gear配電控制系統供應電力,其中的UPS備用電源系統可以在電網供電出現問題時馬上接管電源,保證服務不中斷,同時啟動發電機組,為電池持續充電,直到電力恢復。


>

發電機組相對來說是最簡單的,AWS的基本邏輯就是加一組冗余發電機,發電機壞掉之后可以用另一臺替換。

配電開關系統相對復雜,有一個專門名詞叫做e-house,是用低壓或中壓的控制開關和繼電器來控制線路切斷。但是傳統的開關控制系統內嵌的軟件是預先設定無法改變的,很多功能設計并不適合AWS使用。為了適應AWS的需求,他們自己做了一套配電開關系統,保證在發生事故時,AWS可以最快的速度和極簡的流程處理故障。

UPS系統更加復雜,因為傳統的UPS控制產品功能復雜,但并不一定是AWS需要的,且UPS的鉛酸電池質量重,危險性高,非常不利于數據中心的安全。AWS的做法是把鉛酸電池做成多個小的電池,與機架的的冗余電池搭配使用,用自己開發的控制系統來掌控UPS,從而降低了復雜性和鉛酸電池的破壞力。

任何環節都可能會壞,減小壞的環節對客戶的影響,是AWS維護供電穩定的基本思路。

數據中心

接下來回到數據中心本身。2001年,當AWS還不存在的時候,Amazon run在西雅圖就已經有了數據中心。在這個海嘯和地震頻發的地方,AWS積累了一些數據中心建設的經驗。

比如不能把所有設備都放在一個數據中心,數據中心之間要有適當的距離,以減少災害帶來的破壞。

兩個數據中心的延遲至少有70毫秒,這是物理距離決定的,無法改變。但減小延遲帶來的影響,AWS在綜合考慮了火災、雷電、龍卷風、海嘯、地震等等所有因素的破壞半徑之后,發現了數據中心之間的最優距離是數十英里,并在這個距離的基礎上保證數據中心的延遲在一毫秒之內,最大程度保證數據中心之間的獨立性。

與其他云服務商數據部署的理念有所不同,AWS會細分區域 和 可用區(Available Zone)的區別:

1) 遠距離的可用區設置,可以降低自然災難(火災,水災 )帶來的業務中斷風險;

2) 用戶選擇最近站點接入以低延遲訪問AWS云資源;

本文地址:http://www.383726.tw/chanpinsheji/183454.html 轉載請注明出處!

今日熱點資訊
华东15选5开奖结录 qq麻将作弊器注册码 排列三预测总总汇 黑龙江11选55开奖结果 天津快乐10分预测号 官方彩票平台app下载 明星麻将三缺一单机版 江苏七星麻将灌南 约战武汉麻将app下载 快乐10分开奖 疫情期间村主任赌博 炸金花棋牌游戏规则 安徽波克麻将官方下载 十一运夺金任二技巧 江苏十一选五开奖走势一定牛 青海福彩快三的推荐号 内蒙古泳坛夺金481中奖规则