[转帖]Kdump调试机理详细总结(一)

kdump,调试,机理,详细,总结 · 浏览次数 : 0

小编点评

**Kdump的运行机理** Kdump是一个用于内核崩溃转储的工具,它利用两个内核之间的通信机制来捕获和传输生产内核下的内存。 * **生产内核**在系统崩溃时启动,它会保留一定内存部分用于捕获内核。 * **捕获内核**在收到生产内核的信号时启动,它会从生产内核中加载和运行一个新的内核。 **Kdump的使用步骤** 1. **配置Kdump**:配置Kdump参数,例如内存大小、输出目录等。 2. **启动内核**:运行第一个内核,它作为生产内核运行。 3. **捕获异常**:如果系统出现异常,例如死锁或崩溃,生产内核会触发捕获内核。 4. **生成vmcore文件**:捕获内核的ramdisk中的数据并生成一个ELF文件,这是内核崩溃时使用的内存镜像。 **Kdump的概念** Kdump是一种基于 kexec 的内核崩溃转储机制。 kexec 是一个快速启动机制,允许通过已经运行的内核的上下文启动一个Linux内核,无需经过BIOS,所以第一个内核的内存得以保留。 **其他相关链接** * **Kdump配置及使用详细总结** * **crash工具分析vmcore文件常用命令总结** * **编译linux内核常见报错总结** * **gdb调试常见命令总结** * **Linux下objdump反编译文件命令总结**

正文

https://blog.csdn.net/luckiers/category_11796393.html

一、简介

本文主要讲解Kdump的运行机理,后续两个章节会详细介绍kdump的使用和如何分析coredump文件信息,具体链接如下:

Kdump配置及使用详细总结(二)

crash工具分析vmcore文件常用命令总结(三)

Kdump 的概念出现在 2005 左右,是迄今为止最可靠的内核转存机制,已经被主要的 linux™ 厂商选用。kdump是在系统崩溃、死锁或者死机的时候用来转储内存为vmcore保存到磁盘的一个工具和服务。

1、Kdump相关名词定义:
(1)生产内核:第一个运行的内核(正常的系统运行内核)
(2)捕获内核:第二个运行的内核(系统异常时,会启动捕获内核,用以对生产内核下的内存进行收集和转存)
(3)ramdisk:这里讲的ramdisk实际上就是把一段内存假设为一个硬盘驱动器(使用ramdisk作为文件系统可以大幅提高读写速度)
(4)ELF文件:这里讲的是内核分析出内存的使用和分布等情况,然后把这些信息综合起来生成一个ELF头文件保存起来。
当内核产生错误(系统崩溃、死锁或者死机)时,kdump会将内存导出为vmcore保存到磁盘。

2、Kdump执行流程
(1)First kernel(生产内核)正常运行;
(2)运行过程中,系统出现异常(也可以是模拟通过sysrq触发panic);
(3)在系统崩溃时,系统最后会调用 machine_kexec(),触发并启动Sencond kernel(捕获内核),传递ELF头文件的地址;
(4)捕获内核与相应的ramdisk一起组建一个微环境,获取ELF头文件的地址,并生成出/proc/vmcore文件;
(5)捕获内核的ramdisk中的脚本开始执行,将/proc/vmcore文件中的数据通过文件读写和网络来实现对生产内核下的内存进行收集和转存;
(6)通过gdb、crash等工具,对收集到的vmcore文件镜像分析。
具体流程如下图所示:
在这里插入图片描述

二、Kexec简介

kexec是一个快速启动机制,允许通过已经运行的内核的上下文启动一个Linux内核,不需要经过BIOS,所以第一个内核的内存得以保留,这是内核崩溃转储的本质。
Kdump的实现依赖于Kexec,Kdump 是一种先进的基于 kexec 的内核崩溃转储机制,用来捕获kernel crash(内核崩溃)的时候产生的crash dump。
具体实现步骤:
一是内核空间的系统调用:kexec_load()
负责在生产内核(production kernel 或 first kernel)启动时将捕获内核(capture kernel或sencond kernel)加载到指定地址。
二是用户空间的工具kexec-tools
他将捕获内核的地址传递给生产内核,从而在系统崩溃的时候能够找到捕获内核的地址并运行。没有kexec就没有kdump。先有kexec实现了在一个内核中可以启动另一个内核,才让kdump有了用武之地。
内核空间:kexec_load()
kexec 在 kernel 里以一个系统调用 kexec_load()的形式提供给用户。这个系统调用主要用来把另一个内核和其ramdisk加载到当前内核中。在 kdump中,捕获内核只能使用事先预留的一小段内存。生产内核的内存镜像会被以/proc/vmcore的形式提供给用户。这是一个ELF格式的方件,它的头是由用户空间工具 kexec 生成并传递来的。在系统崩溃时,系统最后会调用machine_kexec()。这通常是一个硬件相关的函数。它会引导捕获内核,从而完成 kdump 的过程。
用户空间:kexec-tools
kdump的很大一部分工作都是在用户空间内完成的。与kexec相关的集中在一个叫“kexec-tools”的工具中的“kexec”程序中。该程序主要是为调用kexec_load()收集各种信息,然后调用之。这些信息主要包括 purgatory 的入口地址,还有一组由 struct kexec_segment描述的信息。

三、Kdump简介

Kdump机制
kdump机制的实现需要两个不同目的的内核,生产内核和捕获内核。生产内核是捕获内核服务的对像。捕获内核会在生产内核崩溃时启动起来,与相应的ramdisk一起组建一个微环境,用以对生产内核下的内存进行收集和转存。
第一个内核保留了内存的一部分给第二内核启动用。由于kdump利用kexec启动捕获内核,绕过了BIOS,所以第一个内核的内存得以保留。这是内核崩溃转储的本质

为了在生产内核崩溃时能顺利启动捕获内核,捕获内核以及它的ramdisk是事先放到生产内核的内存中的。
生产内核的内存是通过/proc/vmcore这个文件交给捕获内核的。为了生成它,用户工具在生产内核中分析出内存的使用和分布等情况,然后把这些信息综合起来生成一个ELF头文件保存起来。捕获内核被引导时会被同时传递这个ELF文件头的地址,通过分析它,捕获内核就可以生成出/proc/vmcore。有了/proc/vmcore这个文件,捕获内核的ramdisk中的脚本就可以通过通常的文件读写和网络来实现各种策略了。

Kexec和Kdump的设计区别:
Kexec的设计是用新内核去覆盖原内核位置;
Kdump的设计是预留一块内存来加载第二个内核(和相关数据),发送Crash后第二个内核在原位置运行(不然就达不到相关目的了),收集第一个内核的相关内存信息(kdump只是用了kexec的快速启动机制,没有全部使用其机制,如内核加载位置存在差别,必须要求捕获内核加载的地址不会覆盖生产内核的内存地址,从而才收集生成内核使用内存的相关信息),具体区别如下图:
在这里插入图片描述
其他相关链接:

1、Kdump配置及使用详细总结(二)

2、crash工具分析vmcore文件常用命令总结(三)

3、编译linux内核常见报错总结

4、gdb调试常见命令总结

5、Linux下objdump反编译文件命令总结

</article>

与[转帖]Kdump调试机理详细总结(一)相似的内容:

[转帖]Kdump调试机理详细总结(一)

https://blog.csdn.net/luckiers/category_11796393.html 一、简介 本文主要讲解Kdump的运行机理,后续两个章节会详细介绍kdump的使用和如何分析coredump文件信息,具体链接如下: Kdump配置及使用详细总结(二) crash工具分析vm

[转帖]Kdump配置及使用(详细)总结(二)

一、简介 本文主要介绍如何打开Kdump并对其相关文件进行配置。前面章节已经对Kdump调试机理进行总结总结,具体可以点击下面链接: Kdump调试机理总结(一) crash工具分析vmcore文件常用命令总结(三) 二、Kdump整体介绍 1、kdump kdump 是一种先进的基于 kexec

[转帖]crash工具分析Kdump下vmcore文件常用命令总结(三)(实例易懂)

一、简介 本文主要介绍使用crash工具对kdump生成的vmcore文件进行分析,解析常见的crash命令,前面已讲述两章关于Kdump的内容,读者感兴趣可以点击下面的链接: 1、Kdump调试机理总结(一) 2、Kdump配置及使用详细总结(二) 系统产生异常时,触发Kdump机制,启动捕获内核

[转帖]

Linux ubuntu20.04 网络配置(图文教程) 因为我是刚装好的最小系统,所以很多东西都没有,在开始配置之前需要做下准备 环境准备 系统:ubuntu20.04网卡:双网卡 网卡一:供连接互联网使用网卡二:供连接内网使用(看情况,如果一张网卡足够,没必要做第二张网卡) 工具: net-to

[转帖]

https://cloud.tencent.com/developer/article/2168105?areaSource=104001.13&traceId=zcVNsKTUApF9rNJSkcCbB 前言 Redis作为高性能的内存数据库,在大数据量的情况下也会遇到性能瓶颈,日常开发中只有时刻

[转帖]ISV 、OSV、 SIG 概念

ISV 、OSV、 SIG 概念 2022-10-14 12:29530原创大杂烩 本文链接:https://www.cndba.cn/dave/article/108699 1. ISV: Independent Software Vendors “独立软件开发商”,特指专门从事软件的开发、生产、

[转帖]Redis 7 参数 修改 说明

2022-06-16 14:491800原创Redis 本文链接:https://www.cndba.cn/dave/article/108066 在之前的博客我们介绍了Redis 7 的安装和配置,如下: Linux 7.8 平台 Redis 7 安装并配置开机自启动 操作手册https://ww

[转帖]HTTPS中间人攻击原理

https://www.zhihu.com/people/bei-ji-85/posts 背景 前一段时间,公司北京地区上线了一个HTTPS防火墙,用来监听HTTPS流量。防火墙上线之前,邮件通知给管理层,我从我老大那里听说这个事情的时候,说这个有风险,然后意外地发现,很多人原来都不知道HTTPS防

[转帖]关于字节序(大小端)的一点想法

https://www.zhihu.com/people/bei-ji-85/posts 今天在一个技术群里有人问起来了,当时有一些讨论(不完全都是我个人的观点),整理一下: 为什么网络字节序(多数情况下)是大端? 早年设备的缓存很小,先接收高字节能快速的判断报文信息:包长度(需要准备多大缓存)、地

[转帖]awk提取某一行某一列的数据

https://www.jianshu.com/p/dbcb7fe2da56 1、提取文件中第1列数据 awk '{print $1}' filename > out.txt 2、提取前2列的文件 awk `{print $1,$2}' filename > out.txt 3、打印完第一列,然后打