服務(wù)器急救常識
發(fā)布日期:2019-09-12 12:15 | 文章來源:互聯(lián)網(wǎng)
服務(wù)器檢查
服務(wù)器急救常識服務(wù)器出現(xiàn)問題后,我們往往會根據(jù)以往的經(jīng)驗(yàn)和知識作出初步的判斷。首先檢查服務(wù)器的安裝環(huán)境:一般服務(wù)器要安裝在通風(fēng)良好的場所,溫度要求在10攝氏度至35攝氏度(運(yùn)行時)或-30攝氏度至60攝氏度(非運(yùn)行時),濕度要求在20%至80%(運(yùn)行時)或5%至90%(非運(yùn)行時)、要有穩(wěn)定和持續(xù)的交流電供應(yīng),否則建議安裝不間斷電源(UPS)、機(jī)房要清潔,防止塵土進(jìn)入。
下面我們列出了一些常用的判斷以及急救常識:
① 服務(wù)器不能啟動可以從以下幾個方面著手考慮解決方法,請先檢查電源、確定服務(wù)器是否和顯示器連接完好、檢查不間斷電源是否工作正常、檢查源是否工作正常、檢查電源指示燈是否工作正常。
② 風(fēng)扇問題我們可以考慮檢查風(fēng)扇是否連接正常、檢查開機(jī)自檢信息、檢查“IntegratedManagement”日志文件。如果是熱插拔風(fēng)扇可以檢查它的LED燈的狀態(tài)。
③ 內(nèi)存問題:檢查內(nèi)存安裝是否正確、確認(rèn)內(nèi)存是否是此款機(jī)器匹配的類型、檢查“IntegratedManagement”日志文件、運(yùn)行系統(tǒng)配置應(yīng)用程序重新配置內(nèi)存、重起后還是出錯請?zhí)鎿Q內(nèi)存。對于AMDCPU的服務(wù)器,內(nèi)存配置比較特殊。
④ 硬盤問題:檢查硬盤電纜是否有問題、檢查硬盤是否是此款機(jī)器匹配的類型、如果是非熱插拔硬盤請檢查硬盤ID號是否正確、如果是熱插拔硬盤請檢查硬盤LED燈的狀態(tài)、檢查硬盤是否有不正常的轉(zhuǎn)動聲、檢查硬盤的firmware。
⑤ 網(wǎng)絡(luò)問題:檢查網(wǎng)絡(luò)環(huán)境和網(wǎng)線是否有問題、檢查網(wǎng)卡資源是否和其他硬件有沖突、檢查驅(qū)動程序是否安裝正確、檢查網(wǎng)卡LED燈的狀態(tài)、如果插在熱插拔PCI槽上請檢查熱插拔PCI是否工作正常等。也可以通過簡化網(wǎng)絡(luò)環(huán)境測試。
服務(wù)器死機(jī)故障比較難以判斷,一般分為軟件和硬件兩個方面:
軟件方面首先檢查操作系統(tǒng)的系統(tǒng)日志,可以通過系統(tǒng)日志來判斷部分造成死機(jī)的原因。電腦病毒也往往會造成服務(wù)器的死機(jī)。系統(tǒng)軟件的bug或漏洞造成的死機(jī),這種故障需要在判斷硬件無故障后做出,而且需要軟件提供商提供幫助。軟件使用不當(dāng)或系統(tǒng)工作壓力過大,可以適當(dāng)降低服務(wù)器的工作壓力來看看能否解決。
硬件方面先要考慮硬件沖突,可以通過對比計算服務(wù)器電源所有的負(fù)載功率的值來判斷是否電源故障或電源供電不足。通過掃描硬盤表面來檢查硬盤是否有壞道;通過主板BIOS中的錯誤報告和操作系統(tǒng)的報錯信息來判斷是否是內(nèi)存故障。一般SCSI/RAID卡或其他pci設(shè)備也有可能會造成系統(tǒng)死機(jī),像這種板卡故障都可以用替換法解決。替換法是主板和CPU最常用的方法。當(dāng)然系統(tǒng)死機(jī)故障在處理完后需要在一段時間內(nèi)進(jìn)行一定壓力的拷機(jī)測試來盡一步檢查故障是否徹底解決。
工程師和用戶彼此合作收集足夠的服務(wù)器信息,才能更好的提出故障解決方案。我們需要搜集故障現(xiàn)象基本信息、操作系統(tǒng)及應(yīng)用軟件信息、系統(tǒng)組件列表、第三方硬件及軟件列表、問題在什么條件下發(fā)生的等。必要時須提供操作系統(tǒng)日志,IML,ADU,ServerSurvey等報告。我們需要知道問題在什么條件下發(fā)生?問題是否在某一固定時間發(fā)生?問題發(fā)生時有無第三方硬件?問題發(fā)生前做了何種操作?問題發(fā)生后做了哪些措施?
建議:1、服務(wù)器一定要定時做備份,且備份工作應(yīng)在用戶訪問較少的時段進(jìn)行,做好備份后,寫清備份記錄并把磁帶放在安全處保存,以便以后恢復(fù)。2、服務(wù)器要做一定的冗余,電源的冗余可以防止意外的電源故障、網(wǎng)卡的冗余可以防止網(wǎng)絡(luò)擁擠,平衡網(wǎng)絡(luò)負(fù)載、磁盤冗余最好做RAID5,既保證性能又有較高的磁盤利用率,有條件的用戶可以做陣列卡的冗余和服務(wù)器的集群等。3、施行自動服務(wù)器恢復(fù)(ASR)。ASR可以檢測到操作系統(tǒng)檢測不到的錯誤包括服務(wù)器死鎖、可以在服務(wù)器失敗后重新啟動、可以防止服務(wù)器受到意外損害(如:溫度過熱時,它可以使服務(wù)器自動關(guān)機(jī),避免部件受到傷害)。
Tags:服務(wù)器檢查,服務(wù)器急救常識
版權(quán)聲明:本站文章來源標(biāo)注為YINGSOO的內(nèi)容版權(quán)均為本站所有,歡迎引用、轉(zhuǎn)載,請保持原文完整并注明來源及原文鏈接。禁止復(fù)制或仿造本網(wǎng)站,禁止在非maisonbaluchon.cn所屬的服務(wù)器上建立鏡像,否則將依法追究法律責(zé)任。本站部分內(nèi)容來源于網(wǎng)友推薦、互聯(lián)網(wǎng)收集整理而來,僅供學(xué)習(xí)參考,不代表本站立場,如有內(nèi)容涉嫌侵權(quán),請聯(lián)系alex-e#qq.com處理。
相關(guān)文章
上一篇:
關(guān)注官方微信