死机分析¶

Solution提供开发过程中以及产品量产后的死机dump机制。

1. 死机分类¶

本平台上的死机主要分为两类：

ASSERT 断言，由RT_ASSERT 触发，在log 里会显示触发的函数名和行数。发生断言时，error_reason 的值为RT_ERROR_ASSERT。
HWFAULT CPU触发的硬件异常，常见有访问非法地址、非法指令等，在log 中会显示具体的异常类型，比如bus fault、mem management fault、usage fault。发生硬件异常时，error_reason 的值为RT_ERROR_HW_EXCEPTION。

针对死机，一般借助于log和死机现场进行分析。

log：通常有执行流程、打印异常后死机原因（断言或HW Fault）、系统信息（线程状态、heap、ipc信息等）等。简单的死机是可以通过log直接进行定位的；
死机现场的分析可分为离线和在线分析：
- 离线分析：离线分析必须要有dump信息。死机后需要抓取dump，结合axf或elf文件，然后用trace32恢复现场来进行分析。
- 在线分析：使用Ozone、j-link，使用调试器attach上被测设备，查看全局变量、memory和寄存器。

死机分析相关介绍可以参见《SDK的文档死机分析指南》。

该工具是思澈开发的log跟踪工具，支持多串口的同时log跟踪，支持finsh命令，集成死机dump以及支持使用DBGUART（52x/56x）模拟JLINK。

AssertDump集成在工具Sifli_Trace中。打开Sifli_Trace，在工具快捷栏点击DUMP图标，将打开AssertDump。

该工具是思澈开发死机dump工具，通过各种内置的脚本支持各种板级的死机dump，其中：

Sifli_UartServer集成在工具Sifli_Trace中。打开Sifli_Trace，在工具快捷栏点击DUMP图标，将打开Sifli_UartServer。

该工具是思澈开发死机使用DBGUART（52x/56x）模拟JLINK的工具。

该工具集成了各种开放相关的测试验证功能，这里主要是使用该工具中的蓝牙dump死机信息。

死机现场的dump有两种情况，

通过连线（52x/56x使用串口；55x/58x使用JLINK）dump

55x/58x需要连接JLink仿真器到目标板（52x/56x不需要）
打开AssertDump工具，
- 设置dump的保存路径
- 选择芯片分类以及型号
- 选择设备（55x/58x选择JLINK， 52x/56x选择UART以及对应的波特率）
- 点击导出

产品量产后，无法飞线抓取log和dump，Solution提供了死机自动保存机制（存放在预留的Flash空间中），使用SiFli_ble工具通过蓝牙dump死机信息

该文件的路径为\sdk\tools\crash_dump_analyser\simarm\t32marm.exe

参照HCPU现场的恢复，其中第1步选择LA。

恢复成功会自动打开以下窗口：

恢复失败时（没有显示异常调用栈），可先确认是不是存在以下情况：

如排除以上情况，可能是保存异常，可以尝试以下几种方法：

从串口log里面打印的16个寄存器中，回填到trace32的register窗口中：
从Jlink halt的log信息加载现场栈。
HR(HCPU Registers)按钮/LR(LCPU Registers)按钮用于恢复没有走到异常处理程序的CPU寄存器,点击按钮后选择导出现场的log.txt文件，他将把里面的寄存器回填到trace32:
从saved_stack_pointer/saved_stack_frame加载寄存器。
saved_stack_pointer/saved_stack_frame如果有保存值，可以将值对应回填到register窗口中：
如果是PC为空，
可以简单设置pc=lr（r14）来尝试查看函数调用关系：