【Linux】驱动内核调试,是需要几板斧的

目录

前言:

一、基础打印工具

 (1)printk—最常用

①Log Buffer:

②Console:

③RAM Console:

(2)动态打印

①动态打印与printk之间的区别联系

②动态打印常用的例子

③动态打印转为printk正常打印

 (3)dump_stack—分析源码的利器

(4)操作寄存器命令—硬件测试

①devmem—系统层面

②ioremap—内核层面

③ /dey/mem—应用层面

二、特殊场景下的打印工具

(1)Oops内核崩溃:

(2)休眠唤醒:

(3)Linux错误码:

(4)Linux kernel中计算代码运行时间:

(5)debugfs


前言:

在VS code编程时我们编写程序时都有输出打印信息,方便查找问题,在驱动开发中,亦有调试的手段和方法,这些是我们解决和排查问题的利器。 

工欲善其事,必先利其器,所以驱动内核调试方法的掌握,是非常有必要的。

参考学习:

https://xuesong.blog.csdn.net/article/details/113062813

https://xuesong.blog.csdn.net/article/details/109522945?spm=1001.2014.3001.5502

Linux内核常用调试手段介绍-Linux笔记

开发环境:

imx6ull pro开发板 

Linux 4.9.88内核 

一、基础打印工具

 (1)printk—最常用

这里它有三个方向去输出,如下图所示:

①Log Buffer:

  • 该Buffer里面的内容可以存储在/proc/kmsg
  • 示例:https://blog.csdn.net/weixin_42373086/article/details/130545341?spm=1001.2014.3001.5501 在这里,使用了很多printk打印信息,可以使用dmesg命令查看。
  • ②Console:

  • Console的实现可以很多,目前我们用到的有UART Console(串口)
  • ③RAM Console:

  • 允许将调试日志信息写入一个被称为RAM Console的设备。
  • 这个主要用于解决系统内核崩溃问题,临终时会将一些日志存储在这里方便后续排查。
  •  这里有很多打印信息,谁优先打印就是一个问题。

    这里printk有8个等级,从0到7,优先级依次降低。

    通常通过修改/proc/sys/kernel/printk来设置打印。

    cat /proc/sys/kernel/printk
    
    //打开所有的内核打印
    echo 8> /proc/sys/kernel/printk

     小于阈值的打印信息,都将输出到控制台上。

    (2)动态打印

    ①动态打印与printk之间的区别联系

  • 在系统运行时,动态打印可以由系统维护者动态打开内核子系统的打印,可以有选择性地打开某些模块的打印。
  • 而printk是全局的,只能设置打印等级。要使用动态打印,必须在内核设置时打开CONFIG_DYNAMIC_DEBUG。
  • 动态打印也有相应的设备节点:/sys/kernel/debug/dynamic_debug。常用于高速设备。
  • 可以打印函数名(f)、行号(l)、模块名字(m)以及线程ID(t)。

    ②动态打印常用的例子

    1.打开一个文件中所有动态打印语句

    echo -n "file gadget.c +p">

    2.打开一个模块中所有动态打印语句

    echo -n "module dwc3 +p">

    3.打开一个函数中所有动态打印语句

    echo "func svc_process +p">

    4.打开文件路径中包含usb的文件里所有的动态打印语句

    echo -n "*usb* +p">

    ③动态打印转为printk正常打印

    开机的时候,没法操作这个动态打印的节点,能否把动态打印转换成默认的printk正常打印,这个如何实现?

    在c文件开头添加:

    //重定义
    #undef dev_dbg
    #define dev_dbg dev_info
    #undef pr_debug
    #define pr_debug pr_info

     (3)dump_stack—分析源码的利器

    分析一个函数的底层调用,离不开dump_stack,因为它是对内核调用栈的打印;当我们不清楚系统回调函数上下文,使用这个方法是非常好的。

    具体demo案例:参照文章

    https://xuesong.blog.csdn.net/article/details/113062813

    (4)操作寄存器命令—硬件测试

    ①devmem—系统层面

    它的原理以及应用场景:

  • 硬件工程师将硬件设计好时,需要进行简单的测试,来查看CPU是否可以正确地读取新硬件系统。
  • 正规的Linux操作方式下,是要有硬件的驱动程序才能完成这个需求。
  • 测试需求只是为了实现简单硬件寄存器读写工作时,devmem命令就非常的适用了。
  • 它的原理就是把硬件的地址空间ioremap映射到用户空间。
  • 具体使用方法,可以参照:

    https://xuesong.blog.csdn.net/article/details/113283070

    ②ioremap—内核层面

    实现的核心代码:

    #define GPIO0_DDR_BASE       ((uint32_t)0xE7A01014) 
    
    static volatile uint32_t *GPIO0_ddr_vreg;
    uint32_t val = 0;
    GPIO0_ddr_vreg = (uint32_t *)ioremap(GPIO0_DDR_BASE, 4); 
    val = readl(GPIO0_ddr_vreg);
    printk("val = %ld\n",val);
    

    ③ /dey/mem—应用层面

    应用层操作寄存器首先需要将内核映射到核外空间,内核已经提供了一个 /dey/mem 的文件接口,这个文件相当于整个系统内存所在,将该文件打开然后指定需要映射的内存的位置即可。需要注意的是,一般 map 映射的是一段内存地址空间。

    具体使用方法:

    https://xuesong.blog.csdn.net/article/details/114156170

    二、特殊场景下的打印工具

    (1)Oops内核崩溃:

    当我们遇到内核崩溃,比如空指针异常、内存访问越界。这时我们只能靠崩溃之后打印出来异常调用栈信息来定位Oops的位置和原因。

    举个例子: 

    在第三行error:Oops信息 kernel BUG at../drivers/mmc/host/sdhci.c  那一行可以简要告知我们是哪里发生问题触发Oops。

    (2)休眠唤醒:

    我们使用的多个模块都会使用到休眠唤醒,每个休眠唤醒都会有相应的休眠唤醒锁。如果想知道当前模块休眠唤醒失败是由哪个斥锁导致的,可以应用下面的命令实现:

    awk '$6 !=0{print $1""$6}' /sys/kernel/debug/wakeup_sources

    (3)Linux错误码:

    错误代码由内核或用户空间应用程序(通过error变量)解释。错误处理在软件开发中非常重要,而不仅仅是在内核开发中。幸运的是,内核提供的几种错误,几乎涵盖了可能遇到的所有错误,有时需要把它们打印出来以帮助进行调试。

    相应文件的路径:

    include/uapi/asm-generic/errno-base.h
    include/uapi/sm-generic/error.h

    具体如下: 

    相应所有错误码说明,可参考:

    Linux错误代码及其含义_linux enxio_wsqyouth的博客-CSDN博客

    (4)Linux kernel中计算代码运行时间:

    对内核或驱动代码做性能优化时,常常要测量一段代码执行时所消耗的时间。

    常用的函数为ktime_get(),在一段代码前后各使用 ktime_get() 获取时间,计算其差值,就是这段代码运行消耗的时间。ktime_get() 能够精确到纳秒级。

    (5)debugfs

    内核中有三个常用的伪文件系统: procfs, debugfs和sysfs。 

    debugfs是内核开发中专门用来调试的文件系统接口,其他的工具或者接口,多数都依赖于debugfs。

    具体如何使用,参考文章:

    https://xuesong.blog.csdn.net/article/details/124112698

    物联沃分享整理
    物联沃-IOTWORD物联网 » 【Linux】驱动内核调试,是需要几板斧的

    发表评论