Created attachment 684 [details] vmcore-dmesg.txt 问题描述:系统频繁 crash 系统版本:Anolis OS release 8.6 kernel 版本:4.19.91-26.iqiyi.1.git.6dd2a08dda3a.an8.x86_64(基于 4.19.91-26.an8.x86_64 开启了group identit 等特性,此前已经稳定运行了 8 个多月) kexec-dmesg.log vmcore vmcore-dmesg.txt 如附件
Created attachment 685 [details] kexec-dmesg.log
看起来和ebpf probe的函数有关系,请@dtccc帮忙看下
vmcore 文件,上传到了百度网盘 链接:https://pan.baidu.com/s/1mQCNFXOFRO46YiT7bKRbeA 提取码:wqwk
测试了这个 https://github.com/deepflowio/deepflow deepflow-agent 使用 ebpf 触发了 crash
(In reply to sunwuhao from comment #4) > 测试了这个 > > https://github.com/deepflowio/deepflow > > deepflow-agent 使用 ebpf 触发了 crash 有没有快速复现的方法或是可以提供的环境?我build这个都费劲。。。
(In reply to dtcccc from comment #5) > (In reply to sunwuhao from comment #4) > > 测试了这个 > > > > https://github.com/deepflowio/deepflow > > > > deepflow-agent 使用 ebpf 触发了 crash > > 有没有快速复现的方法或是可以提供的环境?我build这个都费劲。。。 实际环境是 k8s node 节点一旦跑了 deeplow 的 daemonset agent kernel 就 crash 了 可以用这个 example 来模拟测试,启动了 ebpf 实例,然后通过 ebfp hook 读取相关 io 数据并打印到标准输出 源代码链接: https://github.com/deepflowio/deepflow/tree/main/agent/src/ebpf/samples/rust 可执行文件:ebpf_test上传到附件中了,加个执行权限,直接执行即可
Created attachment 688 [details] ebpf_test
(In reply to sunwuhao from comment #7) > Created attachment 688 [details] > ebpf_test 看起来这个程序用了for循环,在4.19.91-26内核上会被拒绝 back-edge from insn 1876 to 1851 正好手头有个移植了bounded loop的4.19内核能跑,目前还没出问题 另外,看dmesg里,关于probe read的地址只是个warning,和后面真正crash的地方无关 真正crash是因为nmi重入了,和bpf的关联还需要再看
(In reply to dtcccc from comment #8) > (In reply to sunwuhao from comment #7) > > Created attachment 688 [details] > > ebpf_test > > 看起来这个程序用了for循环,在4.19.91-26内核上会被拒绝 > back-edge from insn 1876 to 1851 > > 正好手头有个移植了bounded loop的4.19内核能跑,目前还没出问题 > > 另外,看dmesg里,关于probe read的地址只是个warning,和后面真正crash的地方无关 > 真正crash是因为nmi重入了,和bpf的关联还需要再看 好的,辛苦,主要看看为撒 crash 了
你好,NMI重入的问题已经在4.19.91-27版本中解决 相关PR:https://gitee.com/anolis/cloud-kernel/commit/97ee1061fc39e25f8ad568fe6fe76bd1bc9ce682
(In reply to dtcccc from comment #10) > 你好,NMI重入的问题已经在4.19.91-27版本中解决 > > 相关PR:https://gitee.com/anolis/cloud-kernel/commit/ > 97ee1061fc39e25f8ad568fe6fe76bd1bc9ce682 https://gitee.com/anolis/cloud-kernel/pulls/867
收到,多谢多谢
问题关闭