Description of problem: x86环境ecs.ebmc8i.48xlarge6配置的ECS机器执行echo c >/proc/sysrq-trigger未生成vmcore文件 Steps to Reproduce: 1. 安装crash和kexec-tools包 [root@localhost ~]# rpm -qa|grep crash crash-8.0.6-3.an23.x86_64 [root@localhost ~]# rpm -qa|grep kexec-tools kexec-tools-2.0.26-10.an23.x86_64 2.检查kdump-tools.service为active状态 [root@localhost ~]# systemctl is-active kdump.service active 3.查看/var/crash 目录下文件数量,执行echo c >/proc/sysrq-trigger,等待环境重新连接上后再次查看/var/crash 目录下文件数量 [root@localhost ~]# ls -alt /var/crash/ total 8 drwxr-xr-x. 19 root root 4096 Dec 3 21:30 .. drwxr-xr-x. 2 root root 4096 Dec 3 21:27 . [root@localhost ~]# echo c >/proc/sysrq-trigger 重新连接后: [root@localhost ~]# ls -alt /var/crash/ total 8 drwxr-xr-x. 19 root root 4096 Dec 3 21:30 .. drwxr-xr-x. 2 root root 4096 Dec 3 21:27 . Actual results: 未产生vmcore Expected results: 应该产生一个vmcore文件 Additional info: [root@localhost ~]# cat /etc/os-release NAME="Anolis OS" VERSION="23.4" ID="anolis" VERSION_ID="23.4" PLATFORM_ID="platform:an23" PRETTY_NAME="Anolis OS 23.4" ANSI_COLOR="0;31" HOME_URL="https://openanolis.cn/" BUG_REPORT_URL="https://bugzilla.openanolis.cn/" [root@localhost ~]# uname -r 6.6.102-5.2.an23.x86_64
测试提示:有18个机器执行echo c >/proc/sysrq-trigger 第一次执行都OK了 第二次执行 有一个机器失败了 我用失败的机器再次执行还是失败的
是 nr_cpus 不够分配 irq vector 的已知问题 将 /etc/sysconfig/kdump 里的 nr_cpus=1 改为 nr_cpus=2 后触发了三次crash,均成功生成vmcore 后续落到 kexec-tools 里
https://gitee.com/src-anolis-os/kexec-tools/pulls/45 RP 已经合入,更新包 kexec-tools-2.0.26-11.an23 已经构建 https://build.openanolis.cn/buildinfo?buildID=44519