message日志如下:
1 | kernel: ERST: Error Record Serialization Table (ERST) support is initialized. |
dmesg日志如下:
1 | dmar: Device scope device [0000:00:1a.02] not found |
故障分析:
1 | 由于BIOS中开启了中断重映射(这是个复杂的东西。),在ERST(芯片集中的错误校验表)校验时发生错误,导致高级配置电源管理模块无法处理IPMI驱动请求,预存数据到内存发生错误,引发kernel找到空指针。 |
解决方法:
1 | 在grub.conf的内核启动参数中添加 intremap=off 或者 intremap=no_x2apic_optout |
参考:51CTO
- 本文作者: GaryWu
- 本文链接: https://garywu520.github.io/2018/02/27/记一次线上服务器频繁宕机/
- 版权声明: 本博客所有文章除特别声明外,均采用 MIT 许可协议。转载请注明出处!