29.6. x86-64 機器檢查程式碼的可配置 sysfs 引數¶
機器檢查報告 CPU 檢測到的內部硬體錯誤情況。未糾正的錯誤通常會導致機器檢查(通常伴有 panic),已糾正的錯誤會導致機器檢查日誌條目。
機器檢查被組織成 banks(通常與硬體子系統相關聯)和 bank 中的子事件。 banks 和子事件的確切含義是 CPU 特定的。
mcelog 知道如何解碼它們。
當你在系統日誌中看到“Machine check errors logged”訊息時,mcelog 應該執行以從 /dev/mcelog 收集和解碼機器檢查條目。通常,mcelog 應該從 cronjob 定期執行。
每個 CPU 在 /sys/devices/system/machinecheck/machinecheckN (N = CPU 編號) 中都有一個目錄。
該目錄包含一些可配置的條目。有關更多詳細資訊,請參閱 ABI 檔案測試/sysfs-mce。
TBD 文件條目用於 AMD 閾值中斷配置
有關 x86 機器檢查架構的更多詳細資訊,請參閱 Intel 和 AMD 架構手冊(來自其開發者網站)。
有關架構的更多詳細資訊,請參閱 http://one.firstfloor.org/~andi/mce.pdf