工控機(jī)關(guān)于非藍(lán)屏現(xiàn)象的死機(jī)故障的探討
死機(jī)是工控機(jī)故障中較為常見的一種,同時(shí)它也是最令人頭疼的一種。因?yàn)槠涔收宵c(diǎn)可大可小,而且產(chǎn)生死機(jī)的原因有很多種,另外其故障現(xiàn)象也是多種多樣的,我們可以把故障現(xiàn)象總的歸為兩大類——規(guī)律性死機(jī)和隨機(jī)性死機(jī)。至于死機(jī)現(xiàn)象給人的主觀表現(xiàn)多為“藍(lán)屏”、畫面“定格”無反應(yīng)(同時(shí)鼠標(biāo)和鍵盤也無法輸入)、經(jīng)常出現(xiàn)非法操作(或強(qiáng)行關(guān)閉某程序)、在進(jìn)入操作系統(tǒng)前就已失去反應(yīng)等,在這一篇只討論除藍(lán)屏之外的死機(jī)現(xiàn)象。 乍看上去死機(jī)故障好象很“可怕”,但其故障原因永遠(yuǎn)也脫離不了硬件與軟件這兩方面,下面就以出現(xiàn)死機(jī)故障的前提“條件”來分類說明一下工控機(jī)“死機(jī)”的原因及其處理方法(結(jié)合故障現(xiàn)象),希望對大家會(huì)有一些幫助。
第一類情況:在正常使用的情況下偶爾出現(xiàn)死機(jī)故障且日益頻繁,或突然出現(xiàn)死機(jī)故障后就頻繁出現(xiàn)。
1、因灰塵過多而引發(fā)的頻繁“死機(jī)”故障
一臺(tái)新工控機(jī)在國內(nèi)的一般電廠的中控室使用一年左右后,其內(nèi)部就會(huì)有很多灰塵了,如果進(jìn)入到某個(gè)板卡的插槽中就可能引起該板卡接觸不良而出現(xiàn)死機(jī)或其它故障,而且常是無故死機(jī)。 另外,機(jī)器內(nèi)灰塵過多就會(huì)對某些重要工控機(jī)硬件設(shè)備的散熱問題造成壞的影響,CPU和顯卡等重要硬件如果散熱不良自然就會(huì)引起藍(lán)屏或花屏或定格或黑屏死機(jī)故障,此類死機(jī)現(xiàn)象雖然通常并沒有什么規(guī)律可言,但使用時(shí)間越長其死機(jī)次數(shù)就越頻繁。如果軟驅(qū)磁頭或光驅(qū)激光頭上的灰塵過多的話,那么就會(huì)會(huì)導(dǎo)致讀寫盤困難,嚴(yán)重的就會(huì)引起工控機(jī)藍(lán)屏死機(jī)。
所以說一定要交代錄波器用戶一年對工控機(jī)進(jìn)行一次徹底除塵,當(dāng)然,如果對工控機(jī)結(jié)構(gòu)不是很懂的話的話,就要找一個(gè)懂計(jì)算機(jī)的人來操作,以免造成其它故障。平時(shí)經(jīng)常保持工控機(jī)運(yùn)行環(huán)境的潔凈也是一個(gè)非常不錯(cuò)的措施。 2、因某硬件的散熱不良而導(dǎo)致頻繁“死機(jī)”故障
CPU、顯卡、硬盤、電源等硬件在工作中發(fā)熱量都是非常大的,好在它們多數(shù)都擁有自己的散熱風(fēng)扇,所以通常并不會(huì)因此而發(fā)生死機(jī)現(xiàn)象,但如果風(fēng)扇上的灰塵過多或潤滑不良或磨損嚴(yán)重或嚴(yán)重老化的話,那么這些硬件設(shè)備的散熱就存在問題了,久而久之,隨著情況的不斷惡化,就會(huì)出現(xiàn)在開機(jī)使用一段時(shí)間后頻繁死機(jī)或重啟的現(xiàn)象。
所以說一定要提醒錄波器用戶定期檢查一下工控機(jī)中各風(fēng)扇的工作狀態(tài)并定期為其進(jìn)行潤滑(建議使用縫紉機(jī)油)或者更換以避免此類故障。如果已經(jīng)出現(xiàn)了每次使用都會(huì)頻繁死機(jī)故障的話,也不要著急,只要打開機(jī)箱并在工控機(jī)運(yùn)行時(shí)觀察一下哪個(gè)風(fēng)扇有異常(如噪音很大或轉(zhuǎn)速明顯減慢或停轉(zhuǎn)等)或哪個(gè)硬件溫度異常(如用手一摸某芯片或散熱片非常燙手等),然后再做相應(yīng)的處理就可以了。
3、因內(nèi)存中存在沖突而導(dǎo)致無故“死機(jī)”故障
這一情況在同時(shí)運(yùn)行多個(gè)軟件時(shí)比較容易出現(xiàn),雖然有時(shí)候同時(shí)運(yùn)行很多軟件一切正常,但有時(shí)卻忽然間莫名其妙地死機(jī)了,重新啟動(dòng)后再運(yùn)行這些應(yīng)用程序時(shí)又已十分正常了,其實(shí)這些故障中有很多只是假死機(jī)現(xiàn)象,其原因多是內(nèi)存資源發(fā)生了沖突——應(yīng)用軟件是在內(nèi)存中運(yùn)行的,但有些應(yīng)用軟件由于設(shè)計(jì)方面的原因會(huì)和另一軟件同時(shí)使用同一塊內(nèi)存地址,這時(shí)就會(huì)出現(xiàn)沖突。此類死機(jī)現(xiàn)象通常是定格死機(jī)或重啟或藍(lán)屏或提示“非法操作”或失去響應(yīng)。
對于此類故障只能避免而不能根除——即盡量不要讓很多程序同時(shí)運(yùn)行,避免用戶安裝使用一些不明來源的軟件。 4、因接插件接觸不良而引起無規(guī)律“死機(jī)”現(xiàn)象
此類故障比較好判別,因?yàn)闊o論您運(yùn)行多么小型的程序都有可能會(huì)死機(jī),甚至有時(shí)在啟動(dòng)時(shí)就定格死機(jī),而有時(shí)長時(shí)間運(yùn)行大型程序也不會(huì)死機(jī)。所以此類故障的故障點(diǎn)還是非常好找的,通常您只要把所有能拔下來的東西(如網(wǎng)卡和電源插頭等)都拔下來做清潔再插上去就可以了,當(dāng)然,如果有哪里生銹了的話,您要先除銹或?qū)⑦@個(gè)生銹的部件換新。
5、因內(nèi)存條故障而導(dǎo)致的頻繁“死機(jī)”故障
由于內(nèi)存條的工作頻率越來越高,其發(fā)熱量也隨之升高,而穩(wěn)定性也就要相對差一些了,通常內(nèi)存條故障是指內(nèi)存條松動(dòng)、虛焊或內(nèi)存芯片本身損壞或不穩(wěn)定等。如果工控內(nèi)存插槽上插著著兩個(gè)不同規(guī)格的內(nèi)存,最好去掉一個(gè),使用兩個(gè)不同規(guī)格的內(nèi)存也會(huì)導(dǎo)致死機(jī)。
如果您在WINDOWS操作系統(tǒng)中經(jīng)常出現(xiàn)與內(nèi)存有關(guān)的非法操作等死機(jī)現(xiàn)象或直接提示注冊表出錯(cuò)而重新啟動(dòng)機(jī)器的話,那么我們就要先檢查一下是不是內(nèi)存條松動(dòng)或有灰塵進(jìn)行入到了內(nèi)存插槽內(nèi),如果未發(fā)現(xiàn)異常您就要換一下內(nèi)存條試試了,如果一切正常了那就說明內(nèi)存條本身可能存在故障了。
6、硬盤剩余空間太少或磁盤碎片太多也會(huì)導(dǎo)致“死機(jī)”故障
由于一些大型應(yīng)用程序運(yùn)行時(shí)需要大量的內(nèi)存,如果物理內(nèi)存不足就需要使用硬盤上的虛擬內(nèi)存,此時(shí)如果硬盤的剩余空間太少的話,那么就有可能會(huì)引起死機(jī)現(xiàn)象。另外,如果工控機(jī)長時(shí)間沒有整理硬盤碎片的話也會(huì)使系統(tǒng)資源緊張而死機(jī),當(dāng)然,如果硬盤中的垃圾文件過多的話,也會(huì)造成硬盤尋找文件的困難而造成死機(jī)現(xiàn)象。此類故障的表現(xiàn)也是比較特殊的——通常都是在硬盤連續(xù)“瘋狂”進(jìn)行讀、寫盤操作時(shí)會(huì)突然定格或藍(lán)屏死機(jī)。當(dāng)然,NTFS磁盤文件格式會(huì)產(chǎn)生較少的磁盤碎片。所以系統(tǒng)盤一定要使用NTFS磁盤文件格式。
所以說,您最好是把虛擬內(nèi)存設(shè)置到剩余空間比較大的分區(qū)中,而且要定期清理各種垃圾文件和定期整理磁盤碎片。
7、因硬盤故障而導(dǎo)致頻繁“死機(jī)”故障
如果硬盤嚴(yán)重老化或在運(yùn)行中受到震動(dòng)或出現(xiàn)邏輯、物理壞道或出現(xiàn)壞扇區(qū)的話,那么工控機(jī)在運(yùn)行時(shí)就很容易發(fā)生頻繁死機(jī)故障。至于處理方法最好是更換硬盤,如果只是邏輯錯(cuò)誤的話還是可以用各種修復(fù)軟件進(jìn)行修復(fù)的。由于有些此類故障的故障點(diǎn)并不是很容易就能發(fā)現(xiàn)的,所以如果進(jìn)行“磁盤掃描程序”,也會(huì)排除此類故障。
8、因劣質(zhì)配件而導(dǎo)致的頻繁“死機(jī)”故障
此類故障多是由于使用了品質(zhì)不良的板卡引起的,如果運(yùn)行什么大型程序都死機(jī)的話,就要考慮更換一下電源試試了,這是一個(gè)不容忽視的問題。工控機(jī)內(nèi)安裝有大量的板卡,耗電很厲害,如果電源容量不足,很容易出問題。
所以說在出廠調(diào)試時(shí)一定要嚴(yán)格測試,以免日后出現(xiàn)問題。
9、隨機(jī)啟動(dòng)的程序太多也會(huì)導(dǎo)致無故“死機(jī)”故障
此類死機(jī)故障比較特殊,因?yàn)檫@可謂是名符其實(shí)的無故死機(jī)。現(xiàn)場調(diào)試時(shí),就是去喝個(gè)水的功夫來操作工控機(jī)就會(huì)造成死機(jī)、在關(guān)機(jī)時(shí)也可能會(huì)出現(xiàn)死機(jī),不過好在此類死機(jī)故障并不會(huì)出現(xiàn)在啟動(dòng)時(shí),所以還是比較好判斷的。有人說此類故障只是在內(nèi)存比較小的工控機(jī)中才會(huì)出現(xiàn),但在實(shí)際維修中筆者發(fā)現(xiàn)在大內(nèi)存的工控機(jī)上一樣會(huì)出現(xiàn),因?yàn)橄到y(tǒng)資源是多方面的(除內(nèi)存資源外還包括緩存、GUI、CPU等資源),CPU和硬盤等也會(huì)因此而受不了的,解決方法也很簡單,除了必需的數(shù)據(jù)庫和錄波分析軟件,不要隨機(jī)啟動(dòng)其他的任何程序。
另外,如果桌面上的圖標(biāo)過多或打開的窗口過多的話同樣會(huì)出現(xiàn)無故死機(jī)故障,所以這一點(diǎn)一定也要注意避免,桌面上的圖標(biāo)和“快速啟動(dòng)欄”中的圖標(biāo)越少越好,其它的快捷方式您可放入到“開始”菜單中,通?!伴_始”菜單是沒有什么限制的。
第二類情況:在進(jìn)行了某種操作或發(fā)生某突發(fā)事件后,就頻繁出現(xiàn)死機(jī)故障或根本就無法正常使用工控機(jī)了。
1、在對BIOS設(shè)置進(jìn)行了修改后出現(xiàn)“死機(jī)”故障
有時(shí)運(yùn)行人員為了提高系統(tǒng)的性能往往對硬盤參數(shù)設(shè)置、模式設(shè)置、內(nèi)存參數(shù)、CPU參數(shù)等設(shè)置進(jìn)行了某些錯(cuò)誤的設(shè)置,輕則系統(tǒng)變得不穩(wěn)定而頻繁死機(jī),重則根本就進(jìn)入不了WINDOWS系統(tǒng)了,更有甚者干脆就開不了機(jī)了。
對于無法再開機(jī)的工控機(jī)來說通常只要清除BIOS設(shè)置就行了,在BIOS里選擇“Load fail-safe Defaults(最低性能)”或者“Load optimized Defaults(最高性能)”;對于在進(jìn)入WINDOWS時(shí)就死機(jī)或經(jīng)常要求您進(jìn)入“安全模式”,這時(shí)就要查看一下BIOS中有關(guān)硬盤和CPU的設(shè)置了,另外,如果將沒有ECC功能的內(nèi)存的ECC功能打開的話同樣會(huì)因內(nèi)存錯(cuò)誤而造成死機(jī),這時(shí)可做相應(yīng)的修改或干脆恢復(fù)默認(rèn)值。 2、在添加安裝完某硬件或更新某硬件的驅(qū)動(dòng)程序后出現(xiàn)頻繁“死機(jī)”故障
對于第一類情況來說,通常是發(fā)生了設(shè)備沖突問題,如中斷、DMA、端口、I/O等出現(xiàn)沖突。
對于第二類情況來說,所安裝的硬件驅(qū)動(dòng)程序有兼容性問題。可能是這個(gè)硬件設(shè)備新安裝的驅(qū)動(dòng)程序因和另一個(gè)設(shè)備的驅(qū)動(dòng)程序存在沖突、新驅(qū)動(dòng)程序本身存在問題、新驅(qū)動(dòng)程序與系統(tǒng)的某個(gè)文件存在版本沖突;安裝了別的操作系統(tǒng)下的驅(qū)動(dòng)程序(比如把FOR xp的驅(qū)動(dòng)安裝到了2000操作系統(tǒng)中)以致于發(fā)生死機(jī)故障。由于引發(fā)該故障的可能性非常多,所以要做相應(yīng)的解決方法,比如:以“安全模式”啟動(dòng),然后在“設(shè)備管理器”中進(jìn)行相應(yīng)的查看和設(shè)置?;蛘咝遁d這個(gè)驅(qū)動(dòng),安裝經(jīng)過微軟認(rèn)證的驅(qū)動(dòng)程序。安裝后在硬件驅(qū)動(dòng)程序版本里邊有“數(shù)字簽名程序:Microsoft Windows Hardware Compatibility Publisher”字樣。。
3、在安裝完某個(gè)軟件后只要運(yùn)行某軟件或使用某硬件時(shí)就會(huì)出現(xiàn)“死機(jī)”現(xiàn)象
所安裝的軟件有兼容性問題(例如:可能是測試版本),和其他軟件或者這個(gè)版本的操作系統(tǒng)有沖突。例如某些個(gè)人版軟件不適合安裝在服務(wù)器版操作系統(tǒng)上,強(qiáng)行安裝會(huì)出現(xiàn)此類問題。 卸載導(dǎo)致藍(lán)屏的軟件,或者安裝該軟件和操作系統(tǒng)兼容性好的版本。通常是在安裝了某個(gè)對系統(tǒng)要求非常嚴(yán)格的軟件后才會(huì)出現(xiàn)此類故障。最好不要安裝這個(gè)軟件。如果必須要安裝,可以試試使用其它的非測試版本,兼容性好的同類軟件。
當(dāng)然,有一些軟件是因?yàn)楸旧淼哪硞€(gè)重要文件已損壞才會(huì)導(dǎo)致死機(jī)現(xiàn)象,該類情況多見于以前使用正常,但經(jīng)過一個(gè)突發(fā)事件后就出現(xiàn)問題了的機(jī)器上,這時(shí)只要卸載該軟件并重新安裝一次就可以了。
注意:如果在安裝完一個(gè)新的硬件設(shè)備后出現(xiàn)死機(jī)現(xiàn)象,也可能是由于該新硬件與原已存在的某個(gè)軟件存在兼容問題。
4、對操作系統(tǒng)進(jìn)行了某項(xiàng)設(shè)置后就頻繁出現(xiàn)“死機(jī)”故障
對操作系統(tǒng)進(jìn)行了某項(xiàng)錯(cuò)誤的設(shè)置后經(jīng)常會(huì)出現(xiàn)死機(jī)故障,比如把虛擬內(nèi)存的大小設(shè)置得過小也會(huì)導(dǎo)致在運(yùn)行大型程序時(shí)死機(jī)。由于此類故障原因非常好查找——檢查虛擬內(nèi)存時(shí)改為“讓W(xué)indows 管理”也就可以了。
另外,出廠時(shí)必須把硬盤的休眠功能關(guān)閉;在電源管理里邊把能造成硬盤關(guān)閉的電源使用方案全部刪除。工控機(jī)大部分時(shí)間工作在不經(jīng)常讀、寫硬盤的情況下,這樣的設(shè)置有時(shí)也會(huì)造成數(shù)據(jù)上傳時(shí)硬盤停止響應(yīng)而死機(jī)。
5、在升級(jí)更新操作系統(tǒng)后或更換大容量硬盤后,因內(nèi)存容量不夠而導(dǎo)致“死機(jī)”故障
Windows 2000 和大容量的硬盤對物理內(nèi)存都有更高的要求,如果內(nèi)存容量不夠大的話,就會(huì)因此而發(fā)生死機(jī)故障,而且該死機(jī)現(xiàn)象通常是沒有什么規(guī)律的,通常表現(xiàn)多是藍(lán)屏死機(jī)。
在理論上內(nèi)存容量應(yīng)不小于硬盤容量的0.3~1%,如果內(nèi)存容量不能達(dá)到這個(gè)比例的話,需要把內(nèi)存進(jìn)行相應(yīng)的擴(kuò)容。
6、人為地把某動(dòng)態(tài)鏈接庫文件、系統(tǒng)的初始化文件、系統(tǒng)文件誤刪除后導(dǎo)致系統(tǒng)“死機(jī)”或無法啟動(dòng)
擴(kuò)展名為DLL的文件就是動(dòng)態(tài)鏈接庫文件,在Windows操作系統(tǒng)中它的作用是非常重要的,這些文件從性質(zhì)上來講是屬于共享類文件——即一個(gè)DLL文件可能會(huì)有多個(gè)軟件在運(yùn)行時(shí)需要調(diào)用它;Windows 2000系統(tǒng)在啟動(dòng)時(shí)需要有boot.ini和一些虛擬設(shè)備驅(qū)動(dòng)等文件,如果這些文件被誤刪除或遭破壞的話,那么您就進(jìn)不了Windows了,除非使用Ghost恢復(fù)或者重新安裝系統(tǒng)。
7、因非正常關(guān)閉工控機(jī)而導(dǎo)致“死機(jī)”故障
這里所說的非法關(guān)機(jī)主要是指直接關(guān)閉電源而不用WINDOWS自動(dòng)關(guān)機(jī),通常一次非法關(guān)機(jī)不會(huì)造成太大的危害,但如果長期非法關(guān)機(jī)就有可能造成系統(tǒng)文件損壞或丟失,引起在啟動(dòng)、運(yùn)行中、關(guān)機(jī)時(shí)出現(xiàn)定格,藍(lán)屏等死機(jī)故障。對于Windows操作系統(tǒng)來說這點(diǎn)非常重要,所以只要告訴值班人員正確關(guān)機(jī)就不會(huì)導(dǎo)致此類故障了。
另外,有時(shí)這種非法關(guān)機(jī)還會(huì)造成硬盤出現(xiàn)邏輯錯(cuò)誤而頻繁出現(xiàn)死機(jī),不過好在非法關(guān)機(jī)后系統(tǒng)會(huì)自動(dòng)進(jìn)行磁盤掃描,但有些人會(huì)將其跳過不讓系統(tǒng)進(jìn)行自動(dòng)檢查,交代值班人員不要這么做,不然如果出現(xiàn)邏輯壞道時(shí)就要后悔了。
8、使用病毒實(shí)時(shí)監(jiān)控軟件或防火墻后導(dǎo)致系統(tǒng)經(jīng)常“死機(jī)” 已經(jīng)發(fā)現(xiàn)個(gè)人版的殺毒軟件安裝在Windows 2000 Server上便會(huì)導(dǎo)致系統(tǒng)不穩(wěn)定,如果需要此類軟件,請安裝經(jīng)過測試的企業(yè)版殺毒軟件。
9、因感染了計(jì)算機(jī)病毒而導(dǎo)致了死機(jī)故障
有些病毒可以使計(jì)算機(jī)工作效率和系統(tǒng)資源急劇下降而造成頻繁死機(jī)。對于這一種故障,最好是在系統(tǒng)正常時(shí)把操作系統(tǒng)所在分區(qū)進(jìn)行鏡像備份,到中毒后只要還原一下就行了。
10、在升級(jí)BIOS時(shí)出現(xiàn)意外或升級(jí)失敗或升級(jí)的BIOS文件已損壞而導(dǎo)致死機(jī)故障
如果你從來沒有有過BIOS升級(jí)的經(jīng)驗(yàn)或者硬件不需要升級(jí),建議最好不要這樣做,這是個(gè)很危險(xiǎn)的操作。應(yīng)該把工控機(jī)交給廠商處理。
11、在對某硬件設(shè)備進(jìn)行了熱插拔后出現(xiàn)死機(jī)故障
對IDE接口的硬盤進(jìn)行熱插拔非常容易造成死機(jī)(指雙硬盤),尤其是在某些國產(chǎn)品牌機(jī)中這一現(xiàn)象更為普遍。但這個(gè)死機(jī)故障并不會(huì)持續(xù)太久,通常只要關(guān)機(jī)再開機(jī)就可將問題解決了。另外,雖然說現(xiàn)在有很多設(shè)備都支持熱插拔,但還是不要這么做,畢竟對于電力系統(tǒng)用戶來說“安全”至上。
提交
超越傳統(tǒng)直覺,MATLAB/Simulink助力重型機(jī)械的智能化轉(zhuǎn)型
新大陸自動(dòng)識(shí)別精彩亮相2024華南國際工業(yè)博覽會(huì)
派拓網(wǎng)絡(luò)被Forrester評為XDR領(lǐng)域領(lǐng)導(dǎo)者
智能工控,存儲(chǔ)強(qiáng)基 | ??低晭砭手黝}演講
展會(huì)|Lubeworks路博流體供料系統(tǒng)精彩亮相AMTS展會(huì)