Created attachment 462 [details] 串口日志显示crashkernel下发生oom Description of problem: 在Ampere cpu服务器上测试kdump,发现无法产生完整的vmcore文件 Version-Release number of selected component (if applicable): kernel 4.19.91-26.4 How reproducible: 配置crashkernel=768M Steps to Reproduce: 1.echo 1 > /proc/sys/kernel/sysrq 2.echo c > /proc/sysrq-trigger 3. Actual results: /var/crash/下存在不完整的vmcore Expected results: /var/crash/下存在完整的vmcore Additional info:
目前分析vmcore无法生成有两个原因 一是kexec传递的program header有问题,通过升级kexec-tools版本可以解决 二是由于安培架构和加载的驱动的原因使得需要预留较大的crashkernel大小,通过增大crashkernel的大小可以解决 目前kexec的问题在两台安培机器上都出现了,后续会讨论下解决方案
解决kexec问题需要合入的patch 1. arm64: support more than one crash kernel regions b5a34a20984c4ad27cc5054d9957af8130b42a50 2. arm64: make phys_offset signed 67ea2d99e1356352034dc9d9c7b5ec6dd6b722eb
kexec-tools版本升级为2.0.24之后问题解决,置为fixed