在linux中,可以利用mcelog來查看硬體錯誤;mcelog是用來檢查硬體錯誤的工具,可根據錯誤導致的熱重啟或硬重啟來取得錯誤,熱重啟的錯誤訊息會被捕獲到,硬重啟的錯誤捕獲不到,可用「yum install mcelog」指令進行安裝。
本教學操作環境:linux7.3系統、Dell G3電腦。
1、mcelog 是Linux 系統上用來檢查硬體錯誤,特別是記憶體和CPU錯誤的工具。
未修正的錯誤是關鍵異常,如果 CPU 無法恢復,往往會導致系統上的核心錯誤。這會導致應用程式重置和中斷。
對於未修正的錯誤,mcelog捕捉錯誤的能力取決於錯誤導致熱重啟還是硬重啟。
如果是熱重啟,訊息會被 mcelog 捕獲,恢復後可看到。硬重啟會導致資料遺失,而且 mcelog 可能捕獲不到該事件。
2、安裝
[root@RedHat_test ~]# yum install mcelog.x86_64
3、mcelog的啟動方式
cron : 最老的方式,有確定,計時任務,會失去一些
daemon : el7上用這種,守護程式的方式
trigger :進階一點的方式,觸發的時候,看man mcelog
4、mcelog相關檔案
/dev/ mcelog 設備檔案
/var/log/mcelog messages日誌檔案
/etc/mcelog/mcelog.conf設定檔
/var/run/mcelog.pid
預設故障日誌只記錄在/var/log/mcelog,並沒有記錄到系統日誌中。
如果需要在系統日誌中也體現,需修改/etc/mcelog/mcelog.conf文件,將前面#去掉,並儲存。
#5、mcelog後台運行
[root@RedHat_test ~]# mcelog --daemon
#6、查看系統是否異常
1.手動運行mcelog的方式
[root@RedHat_test ~]# mcelog --daemon
2.查看mcelog日誌
[root@RedHat_test ~]# tail /var/log/mcelog # 什么也没有输出,表明正常
3.查看mcelog守護程式是否偵測到錯誤訊息
[root@RedHat_test ~]# mcelog --client # 什么也没有输出,表明正常
4.解析系統例外時的mcelog輸出
[root@RedHat_test ~]# mcelog --ascii < file.log # or或者 [root@RedHat_test ~]# mcelog --ascii --file file.log
推薦學習:Linux影片教學
以上是linux怎麼查看硬體錯誤的詳細內容。更多資訊請關注PHP中文網其他相關文章!