工業(yè)云計(jì)算平臺(tái)的高可用性設(shè)計(jì)
海得控制推出的工業(yè)云計(jì)算平臺(tái)(代號(hào)為indusCloud)方案是以國(guó)際主流基礎(chǔ)架構(gòu)即服務(wù)(IaaS)技術(shù)為標(biāo)準(zhǔn),以最具影響力的數(shù)據(jù)中心云計(jì)算軟件Openstack開放源代碼為核心,基于它提供的計(jì)算資源管理、存儲(chǔ)管理、網(wǎng)絡(luò)管理、鏡像管理、認(rèn)證管理、計(jì)量管理和其他模塊進(jìn)行一定的二次開發(fā)和功能優(yōu)化而形成的。indusCloud兼容異構(gòu)虛擬化軟件、服務(wù)器設(shè)備、存儲(chǔ)設(shè)備和網(wǎng)絡(luò)設(shè)備,同時(shí)結(jié)合存儲(chǔ)計(jì)算融合的架構(gòu),基于分布式存儲(chǔ),構(gòu)建一個(gè)符合主流技術(shù)的、易于擴(kuò)展的、高可用的、具備國(guó)產(chǎn)自主可控的云計(jì)算虛擬化軟件方案。
indusCloud工業(yè)云計(jì)算平臺(tái)的高可用的設(shè)計(jì)要點(diǎn)包含云計(jì)算管理平臺(tái)高可用、計(jì)算節(jié)點(diǎn)高可用、存儲(chǔ)系統(tǒng)的高可用和網(wǎng)絡(luò)系統(tǒng)的高可用等,最終實(shí)現(xiàn)工業(yè)IT系統(tǒng)及應(yīng)用的高可用性。
云計(jì)算管理平臺(tái)采用硬件級(jí)容錯(cuò)服務(wù)器設(shè)計(jì),采用芯片級(jí)同步處理技術(shù)(Lock-Step)確保任何故障(甚至于瞬時(shí)故障)都能被準(zhǔn)確檢測(cè)到,包括 CPU、內(nèi)存,主板、磁盤、網(wǎng)絡(luò)及電源在內(nèi)的任何故障發(fā)生,系統(tǒng)零秒中斷,無(wú)任何數(shù)據(jù)丟失。從而保障云計(jì)算管理平臺(tái)永遠(yuǎn)持續(xù)在線運(yùn)行,系統(tǒng)可靠性99.9998%以上。內(nèi)置AutomatedUptime Layer系統(tǒng)軟件,用于檢測(cè)潛在問(wèn)題,并預(yù)防中斷。持續(xù)監(jiān)控500 多個(gè)系統(tǒng)組件和傳感器狀態(tài),從而在故障對(duì)系統(tǒng)造成影響之前對(duì)其進(jìn)行識(shí)別、處理和報(bào)告。提供單一系統(tǒng)管理視圖,并結(jié)合廣泛的狀態(tài) LED 指示燈,從而消除管理復(fù)雜性。
云計(jì)算管理平臺(tái)可以根據(jù)負(fù)載進(jìn)行智能分析調(diào)度,實(shí)現(xiàn)統(tǒng)一資源池中節(jié)點(diǎn)負(fù)載均衡,更好的利用資源。無(wú)論是計(jì)算還是存儲(chǔ)系統(tǒng),在發(fā)生故障的時(shí)候可以自動(dòng)快速恢復(fù)。這種分布式計(jì)算系統(tǒng)和存儲(chǔ)系統(tǒng)設(shè)計(jì),很容易擴(kuò)展,新節(jié)點(diǎn)只需要簡(jiǎn)單配置,便能自動(dòng)開始承載負(fù)荷,實(shí)現(xiàn)資源池的橫向擴(kuò)展。
對(duì)于數(shù)據(jù)中心大多數(shù)應(yīng)用系統(tǒng),通過(guò)虛擬機(jī)HA熱遷移高可用性技術(shù),可以避免因”計(jì)劃內(nèi)停機(jī)”而導(dǎo)致業(yè)務(wù)中斷。通過(guò)監(jiān)控主機(jī)IPMI數(shù)據(jù),在物理機(jī)出現(xiàn)故障預(yù)警時(shí)動(dòng)態(tài)遷移該節(jié)點(diǎn)上的虛擬機(jī)至健康的主機(jī)節(jié)點(diǎn)上。即使是”計(jì)劃外停機(jī)(如物理機(jī)突然奔潰)”,運(yùn)行在上面的虛擬機(jī)遷移恢復(fù)時(shí)間也可以控制在幾分鐘以內(nèi),保障業(yè)務(wù)連續(xù)運(yùn)行。
然而對(duì)于重量級(jí)的核心數(shù)據(jù)庫(kù)系統(tǒng),關(guān)鍵應(yīng)用管理系統(tǒng)。需要更高可靠性的系統(tǒng)設(shè)計(jì)方案,完全可以避免因”計(jì)劃外宕機(jī)”而導(dǎo)致的業(yè)務(wù)中斷。其中最具有代表性的是海得公司推出的H&I SERVER冗余容錯(cuò)服務(wù)器方案。主要特征是,基于硬件虛擬化設(shè)計(jì),采用虛擬內(nèi)存同步技術(shù)和IO多路徑熱轉(zhuǎn)移技術(shù),實(shí)現(xiàn)客戶虛擬機(jī)系統(tǒng)在冗余的物理機(jī)節(jié)點(diǎn)間雙活同步運(yùn)行,包括芯片、內(nèi)存、主板、電源在內(nèi)的任何物理節(jié)點(diǎn)故障發(fā)生,虛擬機(jī)系統(tǒng)連續(xù)不中斷運(yùn)行。可靠性定義在99.999%以上。
indusCloud通過(guò)底層分布式存儲(chǔ)技術(shù),將x86服務(wù)器節(jié)點(diǎn)組成一個(gè)高可用的分布式存儲(chǔ)資源池。indusCloud上層將存儲(chǔ)資源池化成云硬盤(塊存儲(chǔ)),為用戶提供云硬盤管理服務(wù)。分布式存儲(chǔ)可以實(shí)現(xiàn)文件的多副本保存,同一份數(shù)據(jù)在多個(gè)物理節(jié)點(diǎn)分散存儲(chǔ),單物理節(jié)點(diǎn)上的硬盤也通過(guò)硬件RAID做磁盤級(jí)別的防護(hù),避免單點(diǎn)失效,同時(shí)分布式存儲(chǔ)擁有智能恢復(fù)和均衡技術(shù),在遇到故障時(shí)能夠?qū)崿F(xiàn)自動(dòng)容錯(cuò)和負(fù)載協(xié)同。
集中式存儲(chǔ)(共享磁盤陣列)采用雙活控制器容錯(cuò)設(shè)計(jì),Mirror-Cache高速緩存鏡像技術(shù),實(shí)現(xiàn)故障零秒切換功能。全冗余及模塊化設(shè)計(jì),無(wú)單點(diǎn)故障。所有部件如電源、風(fēng)扇、控制器和硬盤均支持在線不停機(jī)更換。99.999%以上可靠性。
網(wǎng)絡(luò)層面的高可用主要保證所有連接冗余,每個(gè)服務(wù)器配備雙物理卡網(wǎng)絡(luò)層面的高可用主要保證所有連接冗余,交換機(jī)和防火墻也配備了雙活冗余(如鏈路聚合,VRRP等),避免因單點(diǎn)失效而導(dǎo)致的網(wǎng)絡(luò)中斷。
提交
直播定檔!見證西門子與中科摩通聯(lián)手打造汽車電子智能制造新范式
光亞論壇·2024 智能產(chǎn)業(yè)聚合高峰論壇舉辦!
新訊受邀參加華為Redcap產(chǎn)業(yè)峰會(huì),并榮獲RedCap生態(tài)合作獎(jiǎng)!
2024年斯凱孚創(chuàng)新峰會(huì)暨新產(chǎn)品發(fā)布會(huì)召開,以創(chuàng)新產(chǎn)品矩陣重構(gòu)旋轉(zhuǎn)
禹衡光學(xué)亮相北京機(jī)床展,以創(chuàng)新助力行業(yè)發(fā)展新篇章