工控機(jī)磁盤工作故障的防護(hù)與排除辦法
2005/4/19 14:20:00
摘 要:山玻集團(tuán)廊坊金彪600T高新玻璃生產(chǎn)線有著包括ABB AC800F和西門子300 PLC等四套自動(dòng)化控制系統(tǒng),上位機(jī)采用Citect、Freelance 2000、WCC5.0、SETP7 5.2等上位機(jī)組態(tài)軟件監(jiān)控。近期電網(wǎng)波動(dòng),導(dǎo)致多臺(tái)工業(yè)控制計(jì)算機(jī)發(fā)生系統(tǒng)磁盤故障,給正常生產(chǎn)帶來(lái)巨大威脅。作者采用雙硬盤備份和GHOST鏡像等方法,一定程度上避免了上述事態(tài)的進(jìn)一步發(fā)展。本文將從故障現(xiàn)象、出現(xiàn)原因及防護(hù)方法做一一敘述。 關(guān)鍵字:工業(yè)控制計(jì)算機(jī)、磁盤、GHOST 一、 引言: 隨著工業(yè)與計(jì)算機(jī)的快速發(fā)展,在自動(dòng)化程度越來(lái)越高的今天,計(jì)算機(jī)也應(yīng)用到自動(dòng)化控制系統(tǒng)的方方面面。工業(yè)控制計(jì)算機(jī)(以下簡(jiǎn)稱工控機(jī))的安全也顯得尤為重要。工控機(jī)與普通計(jì)算機(jī)的技術(shù)原理相同,組成結(jié)構(gòu)也差不多,只是在工控機(jī)強(qiáng)調(diào)的是其工作穩(wěn)定性。工控機(jī)一般工作在相對(duì)惡劣的環(huán)境下工作的,對(duì)環(huán)境溫度、濕度、供及電壓、平穩(wěn)性、通風(fēng)性能等要求比較高,但工作環(huán)境往往達(dá)不到要求,工控機(jī)也容易發(fā)生故障,部分硬件出現(xiàn)問(wèn)題還能及時(shí)更換,一旦磁盤發(fā)生損壞,會(huì)造成大量記錄數(shù)據(jù)丟失,控制軟件破壞,短時(shí)間無(wú)法修復(fù),造成被控參數(shù)控制不穩(wěn),往往帶來(lái)巨大的經(jīng)濟(jì)損失。 二、 故障現(xiàn)象描述: 工控機(jī)長(zhǎng)時(shí)間運(yùn)行后,(長(zhǎng)時(shí)間指:包括連續(xù)工作一個(gè)標(biāo)準(zhǔn)月30天/24小時(shí)工作制及以上的時(shí)間),機(jī)箱內(nèi)積集大量灰塵,機(jī)箱溫度較高。通常在不關(guān)機(jī)的情況下一切工作正常,一旦因電力供應(yīng)不足或需要緊急停機(jī)時(shí),控制系統(tǒng)容易出現(xiàn)磁盤無(wú)法啟動(dòng)、系統(tǒng)無(wú)法加載、長(zhǎng)時(shí)間處于登陸畫(huà)面等故障。以山東玻璃集團(tuán)廊坊高新玻璃生產(chǎn)線的10臺(tái)操作員站和4臺(tái)工程師站為例: 系統(tǒng)配置: 工 控 機(jī):研華工控機(jī)、DELL GX270 操作系統(tǒng):Windows 2000 Professional /Windows 98(一臺(tái))(正版) 控制軟件:Citect、Freelance 2000、WCC5.0、SETP7 5.2等正版軟件 輔助軟件:WINRAR 3.0、Windows 2000 Professional SP4補(bǔ)丁等 工作時(shí)間:全年全日制工作(365天*24小時(shí)) 工作環(huán)境:環(huán)境溫度利用空調(diào)控制在10攝氏度到30攝氏度之間、地面有輕微機(jī)械震感、空氣有可吸入顆粒物。 空氣濕度:5%~50%RH 自2003年12月運(yùn)行以來(lái),共有三臺(tái)計(jì)算機(jī)累計(jì)五次出現(xiàn)磁盤錯(cuò)誤導(dǎo)致無(wú)法啟動(dòng)的故障。筆者與微軟操作系統(tǒng)服務(wù)部聯(lián)系至今也沒(méi)有得到可靠回復(fù)。 三、 故障分析及排除方法: 引起磁盤故障的原因非常多,我們?cè)谶@里大概的分為磁盤本身的質(zhì)量問(wèn)題和工作環(huán)境引起的故障問(wèn)題。 磁盤本身的質(zhì)量問(wèn)題,我們無(wú)法深入考究,只有在開(kāi)始做控制系統(tǒng)時(shí),選擇購(gòu)買質(zhì)量、品牌較好硬盤,也可以利用Scandisk、Norton Disk Doctor等軟件進(jìn)行磁盤表面缺陷檢測(cè)。假如我們能夠預(yù)知硬盤的質(zhì)量和健康狀態(tài),這將為我們選擇硬盤和備份重要數(shù)據(jù)贏得時(shí)間。筆者在網(wǎng)上發(fā)現(xiàn)一款名為Drive Health軟件,可以檢測(cè)硬盤的使用壽命,可以幫助大家提前得知硬盤健康狀態(tài)。 工作環(huán)境引起的故障問(wèn)題,常見(jiàn)的有下面幾個(gè)方面: 1、 工控機(jī)工作時(shí)間長(zhǎng)。由于正常生產(chǎn)的需要,部分工廠的工業(yè)控制系統(tǒng)需要長(zhǎng)時(shí)間工作,給工控機(jī)操作系統(tǒng)帶來(lái)巨大考驗(yàn)。據(jù)微軟的操作系統(tǒng)運(yùn)行時(shí)間報(bào)告中表明,微軟聲稱其Windows 2000后的操作系統(tǒng)可以支持長(zhǎng)時(shí)間工作,但從實(shí)際運(yùn)行看,運(yùn)行時(shí)間超過(guò)一周后,磁盤在龐大數(shù)據(jù)交換過(guò)程中,會(huì)積累大量的數(shù)據(jù)碎片,容易造成磁盤邏輯壞道、讀寫(xiě)錯(cuò)誤及系統(tǒng)運(yùn)行和啟動(dòng)變慢。所以工控機(jī)在生產(chǎn)允許的情況下,可定時(shí)進(jìn)行重啟工控機(jī)和磁盤碎片整理,以減少因長(zhǎng)時(shí)間工作導(dǎo)致的磁盤錯(cuò)誤。重啟時(shí)間可按工控機(jī)處理數(shù)據(jù)量的大小和生產(chǎn)情況而定,它不是硬性的,需要讀者慢慢摸索。從筆者的實(shí)際經(jīng)驗(yàn)來(lái)看,一個(gè)標(biāo)準(zhǔn)月(30天)重啟和整理一次工控機(jī)可以減少磁盤錯(cuò)誤的機(jī)率。 2、 工控機(jī)內(nèi)部溫度過(guò)高。在需長(zhǎng)時(shí)間高溫運(yùn)行的環(huán)境中,計(jì)算機(jī)各元件極易發(fā)生老化、硬盤故障的頻率也較之升高。這就需要工廠的自動(dòng)化系統(tǒng)維護(hù)人員在日常巡檢中,密切關(guān)注機(jī)箱溫度,盡量使工控機(jī)的溫度保持在10--30攝氏度之間,過(guò)高、過(guò)低的溫度都不適宜硬盤的保護(hù),如果機(jī)箱溫度達(dá)到30攝氏度,內(nèi)部硬盤的溫度會(huì)達(dá)到40度或更高。我們可以簡(jiǎn)單DIR一下自己的工控機(jī),以達(dá)到降低環(huán)境溫度的作用。一、更換大功率CPU、硬盤風(fēng)扇(硬盤風(fēng)扇要注意固定,不宜安裝在硬盤固件架上,以防因風(fēng)扇轉(zhuǎn)動(dòng)帶來(lái)硬盤震動(dòng))加快散熱;二、在機(jī)箱內(nèi)部加裝向機(jī)箱外抽風(fēng)的風(fēng)扇,增加空氣對(duì)流;三、在放置工控機(jī)的機(jī)柜上,安裝小型軸流風(fēng)機(jī);四、在控制室加裝空調(diào),以降低空間溫度。 3、 環(huán)境濕度不適宜。工控機(jī)主要是由眾多電子元件的集成電路構(gòu)成,其絕緣性能跟環(huán)境濕度有很大關(guān)系。濕度過(guò)大,容易造成電路板短路而燒毀;濕度過(guò)小,容易產(chǎn)生靜電,也會(huì)擊穿部分電子元件。因此,濕度過(guò)大、過(guò)小,都會(huì)給工控機(jī)帶來(lái)潛在的威脅。靜電防護(hù)問(wèn)題上要求我們工控機(jī)上必須要有良好的儀表接地。值得說(shuō)明的是,工控機(jī)接地極不同與土建上的防雷接地,接地極選址應(yīng)距控制室處三米遠(yuǎn),在室外的地坪下1700mm處用∮20鍍鋅角鋼作垂直接地極,接地?cái)?shù)量滿足接地電阻小于1歐姆(回填時(shí)應(yīng)用搖表測(cè)試),再采用40*40*4鍍鋅扁鋼與接地體可靠焊接(每個(gè)焊接點(diǎn)還要做仔細(xì)的防銹處理),分至建筑物內(nèi)換接25mm銅電纜至系統(tǒng)地端子和工控機(jī)接地點(diǎn)。這樣可以有效的減少靜電帶來(lái)的危害。 4、 地面震感大。很多工廠生產(chǎn)中需要電機(jī)產(chǎn)生拖動(dòng)、震動(dòng)等物理性位移動(dòng)作,不僅帶來(lái)巨大的噪音,機(jī)器工作時(shí)帶來(lái)的震動(dòng)會(huì)給工控機(jī)磁盤、光驅(qū)、軟驅(qū)帶來(lái)巨大的損害。磁盤生產(chǎn)的工藝越來(lái)越高,現(xiàn)行轉(zhuǎn)速已達(dá)到7200轉(zhuǎn)每秒乃至更高。在自動(dòng)化控制系統(tǒng)中的大量數(shù)據(jù)交換中,長(zhǎng)時(shí)間、高速度運(yùn)轉(zhuǎn)的磁盤,容易因磁盤震動(dòng),導(dǎo)致磁盤讀寫(xiě)能力下降,磁頭定位緩慢,甚至造成磁盤損壞;因此減少工控機(jī)環(huán)境震感,有利于保護(hù)磁盤。我們可以在工程設(shè)計(jì)時(shí),盡可能的讓工控機(jī)遠(yuǎn)離震源大的工作現(xiàn)場(chǎng);如果工作地點(diǎn)無(wú)法更改,我們還可以在工控機(jī)柜、箱體下墊置海綿、可緩沖性物體以減小震動(dòng)帶來(lái)的危害。 5、 空氣中的可吸入顆粒物多。很多工廠的原料大多需要粉料進(jìn)行加工,加上外界空氣流動(dòng)大、沙塵多,工控機(jī)內(nèi)容易集積大量粘糊狀積塵,造成工控機(jī)內(nèi)局部溫度過(guò)高,帶來(lái)硬件損壞。這種情況多發(fā)于CPU、電源、硬盤、顯卡等散熱風(fēng)扇周圍。積塵較輕的地方,在正常生產(chǎn)允許的情況下,可以采用定時(shí)吹塵。積塵較嚴(yán)重的地方,可以工控機(jī)箱透風(fēng)處安置濾塵紗布,定期清理。 6、 供電電壓波動(dòng)大、易停電。工業(yè)和生活快速的發(fā)展,對(duì)電的需求量也日益增大,很多地區(qū)有電力供應(yīng)不足、電壓不穩(wěn)、易停電的情況發(fā)生。電壓不穩(wěn)和突然停電,造成系統(tǒng)頻繁重啟,系統(tǒng)文件也容易因此發(fā)生丟失而無(wú)法正常啟動(dòng);正在執(zhí)行讀寫(xiě)動(dòng)作的磁頭,有時(shí)會(huì)因?yàn)橥k娫斐纱蓬^回位不準(zhǔn)帶來(lái)工控機(jī)磁盤故障。因此工控機(jī)工作環(huán)境電源的穩(wěn)定關(guān)系到工控機(jī)工作正常與否。我們可以采用穩(wěn)壓電源和UPS不間斷電源進(jìn)行保護(hù),具體設(shè)備選型,要依負(fù)載功率大小、需保持工作時(shí)間多少來(lái)定。 四、 故障救急策略: 很多時(shí)候,我們的工控人員做了很多保護(hù)工作,仍然有工控機(jī)磁盤發(fā)生故障的情況,下面我們就與讀者探討一下如何在發(fā)生故障前采取補(bǔ)救措施。建議讀者先學(xué)會(huì)使用GHOST(著名的磁盤克隆軟件)軟件,對(duì)象版本盡可能最新,這將有助于下列方案的實(shí)施。 無(wú)需資金投入方案:GHOST克隆鏡像。 方案前提:僅僅系統(tǒng)盤出現(xiàn)故障,系統(tǒng)盤可以被FORMAT軟件正常格式化。(筆者曾遇到兩次無(wú)法正常用FORMAT軟件格式化系統(tǒng)盤,主從盤方式下,訪問(wèn)壞磁盤的系統(tǒng)盤時(shí),提示參數(shù)錯(cuò)誤,采用低格后恢復(fù)) 方案材料:GHOST軟件、DOS系統(tǒng)引導(dǎo)盤(可光盤、軟件、U盤) 方案實(shí)施:磁盤故障大多發(fā)生在系統(tǒng)盤(C盤),在自動(dòng)化系統(tǒng)正式投入運(yùn)行后,首先利用GHOST軟件,對(duì)系統(tǒng)盤進(jìn)行鏡像,將鏡像文件(*.GHO)放至FAT32磁盤格式下進(jìn)行備份(因?yàn)閱未疟P情況下,對(duì)系統(tǒng)盤進(jìn)行GHOST恢復(fù),一般在DOS下進(jìn)行,DOS只能運(yùn)行在FAT32、FAT16等磁盤格式下,在NTFS的分盤格式下是不能被運(yùn)行的。),一旦系統(tǒng)盤發(fā)生故障,最快的方法可將系統(tǒng)盤格式化掉,利用GHOST軟件可在5分鐘左右將原鏡像好的文件恢復(fù)到系統(tǒng)盤。 方案結(jié)論:無(wú)需設(shè)備投入,無(wú)需資金花銷;恢復(fù)速度快。此方案只能針對(duì)于操作系統(tǒng)破壞而非磁盤發(fā)生物理性損壞的情況下采用;一旦磁盤物理?yè)p壞,此方案將無(wú)法進(jìn)行。這也可推廣至整個(gè)磁盤鏡像。 經(jīng)濟(jì)型方案:克隆雙硬盤備份+GHOST鏡像 方案前提:工控機(jī)磁盤故障(無(wú)論是系統(tǒng)故障還是磁盤物理性損壞) 方案材料:目標(biāo)工控機(jī)內(nèi)同型號(hào)磁盤一塊、GHOST軟件、DOS系統(tǒng)引導(dǎo)盤(可光盤、軟件、USB盤) 方案實(shí)施:在工控機(jī)系統(tǒng)投入運(yùn)行之前,利用GHOST軟件先將存有控制系統(tǒng)磁盤的系統(tǒng)盤(C盤)鏡像至該磁盤的非系統(tǒng)盤FAT32磁盤格式分區(qū)下,再將其整個(gè)硬盤內(nèi)容完整克隆至同型號(hào)備用磁盤內(nèi)。一旦出現(xiàn)操作系統(tǒng)損壞,可將操作系統(tǒng)鏡像文件恢復(fù);如果發(fā)生整個(gè)磁盤故障,可將壞磁盤拆除,換上先向備份好同樣內(nèi)容的備用硬盤即可。 方案結(jié)論:只需投入一塊磁盤的資金(約400-800元人民幣之間,視磁盤大小、廠商的不同)、更換容易、恢復(fù)速度快、可排除所有磁盤問(wèn)題。 安全性投入方案(經(jīng)濟(jì)型):采用Windows 2000雙硬盤RAID1或三硬盤RAID5方式的軟件磁盤陣列 方案前提:此方案的實(shí)施時(shí)間,最好在工控機(jī)投入運(yùn)行之前 方案材料:Windows 2000系統(tǒng)盤或更高版本、磁盤兩塊(型號(hào)相同為宜) 方案實(shí)施:首先安裝Windows 2000系統(tǒng)或更高版本(因?yàn)槲④浽赪indows NT后對(duì)磁盤陣列比較好),啟動(dòng)磁盤陣列功能支持。磁盤陣列方式能在工控機(jī)運(yùn)行時(shí)的寫(xiě)操作,同時(shí)向兩塊磁盤寫(xiě)入相同的內(nèi)容,假如兩塊磁盤有一塊發(fā)生故障時(shí),<
提交
查看更多評(píng)論
其他資訊
STEP-7-V5.1編程使用手冊(cè)
初探PID過(guò)程控制
淺析ABB AC800F在浮法玻璃換火過(guò)程控制系統(tǒng)的實(shí)現(xiàn)