dmp文件分析（三）- 栈帧结构和原理

Aug 21, 2020 breakpad 源码分析

| 阅读 | 共 2221 字，阅读约 5 分钟

| 复制链接:

Overview

上一篇文件讲解了一个崩溃调用栈中第一个栈帧的分析过程：

分析完一个栈帧后，会根据栈帧结构，查找上层调用函数的eip，继续分析下一个栈帧，再继续分析源码之前，先介绍一下栈帧结构和寄存器相关知识，breakpad中主要用到eip、ebp、esp

寄存器是CPU内部用来存放数据的一些小型存储区域，包括通用寄存器、专用寄存器和控制寄存器。寄存器拥有非常高的读写速度，所以在寄存器之间的数据传送非常快。不同架构cpu的寄存器不一样，本文介绍32位cpu经典寄存器。包括：

寄存器

数据寄存器用于保存操作数和计算结果
EAX、EBX、ECX、EDX为32位寄存器，对低16位数据的读取，不会影响高16位数据的读取
低16位寄存器命名为：AX、BX、CX、DX
低16位寄存器又可分割为8个独立的位寄存器，每个寄存器有自己独立的名字，可以独立存取
- AX：AH-AL
- BX：BH-BL
- CX：CH-CL
- DX：DH-DL
EAX：累加器，用于乘、除、输入、输出（赋值）等操作，使用频率很高
EBX：基地址寄存器，经常当做返回值使用
ECX：计数寄存器，用于控制循环次数
EDX：数据寄存器，在乘、除运算时的作为默认操作数，也可用于io操作存储端口

标志寄存器包括多个标志位：

在真正了解栈帧结构前，需要对虚拟地址空间和进程地址空间有一定了解。

操作系统提供了内存的一种抽象概念：虚拟地址空间，使得应用程序不用关心物理内存就可以执行操作
虚拟地址空间分为两类：
- 内核空间：32位系统，0xC000000000~0xFFFFFFFF共1G的大小
- 用户空间：32位系统，0x0000000000~0xBFFFFFFF共3G的大小
内核空间是系统预留的，用户进程只能使用用户空间

地址空间

一个函数在运行时，会在栈上申明局部变量，为单个过程分配的那部分栈就叫做栈帧。当有子函数调用时，会继续在栈上形成新的栈帧。调用者与被调用者形成的栈帧结构为：

栈帧结构

栈帧有如下特点：

函数调用可能是有很多层的，但是EBP和ESP只有两个，它是如何实现函数调用的呢？— 跟保存局部变量一样，将上一个栈帧的EBP入栈保存，函数调用结束时，将EBP出栈，就能快速恢复上一次的栈帧。

函数返回时，从EAX获取返回值，之后需要将栈结构恢复到调用开始的状态，并跳转到父函数的返回地址继续执行。由于函数调用时，已经保存了返回地址和父函数栈帧起始地址，只需执行两步即可恢复栈帧：

使用汇编语言描述，可以表示为：

1mov %ebp %esp
2pop %ebp

由上面的分析，可以发现，只需要知道当前栈帧的寄存器情况，就可以通过一定规律，还原整个堆栈调用过程，表示的公式如下，这个公式将在breakpad中的栈帧查找中用得到：

caller: 调用函数（父函数） callee: 被调用函数(子函数)

1%caller_esp = *(%callee_ebp + 16)
2%caller_eip = *(%callee_ebp + 8)
3%caller_ebp = *(%callee_ebp)