1.. SPDX-License-Identifier: GPL-2.0 2 3.. include:: ../disclaimer-zh_CN.rst 4 5:Original: Documentation/dev-tools/kasan.rst 6:Translator: 万家兵 Wan Jiabing <wanjiabing@vivo.com> 7 8内核地址消毒剂(KASAN) 9===================== 10 11概述 12---- 13 14Kernel Address SANitizer(KASAN)是一种动态内存安全错误检测工具,主要功能是 15检查内存越界访问和使用已释放内存的问题。 16 17KASAN有三种模式: 18 191. 通用KASAN 202. 基于软件标签的KASAN 213. 基于硬件标签的KASAN 22 23用CONFIG_KASAN_GENERIC启用的通用KASAN,是用于调试的模式,类似于用户空 24间的ASan。这种模式在许多CPU架构上都被支持,但它有明显的性能和内存开销。 25 26基于软件标签的KASAN或SW_TAGS KASAN,通过CONFIG_KASAN_SW_TAGS启用, 27可以用于调试和自我测试,类似于用户空间HWASan。这种模式只支持arm64,但其 28适度的内存开销允许在内存受限的设备上用真实的工作负载进行测试。 29 30基于硬件标签的KASAN或HW_TAGS KASAN,用CONFIG_KASAN_HW_TAGS启用,被 31用作现场内存错误检测器或作为安全缓解的模式。这种模式只在支持MTE(内存标签 32扩展)的arm64 CPU上工作,但它的内存和性能开销很低,因此可以在生产中使用。 33 34关于每种KASAN模式的内存和性能影响的细节,请参见相应的Kconfig选项的描述。 35 36通用模式和基于软件标签的模式通常被称为软件模式。基于软件标签的模式和基于 37硬件标签的模式被称为基于标签的模式。 38 39支持 40---- 41 42体系架构 43~~~~~~~~ 44 45在x86_64、arm、arm64、powerpc、riscv、s390、xtensa和loongarch上支持通用KASAN, 46而基于标签的KASAN模式只在arm64上支持。 47 48编译器 49~~~~~~ 50 51软件KASAN模式使用编译时工具在每个内存访问之前插入有效性检查,因此需要一个 52提供支持的编译器版本。基于硬件标签的模式依靠硬件来执行这些检查,但仍然需要 53一个支持内存标签指令的编译器版本。 54 55通用KASAN需要GCC 8.3.0版本或更高版本,或者内核支持的任何Clang版本。 56 57基于软件标签的KASAN需要GCC 11+或者内核支持的任何Clang版本。 58 59基于硬件标签的KASAN需要GCC 10+或Clang 12+。 60 61内存类型 62~~~~~~~~ 63 64通用KASAN支持在所有的slab、page_alloc、vmap、vmalloc、堆栈和全局内存 65中查找错误。 66 67基于软件标签的KASAN支持slab、page_alloc、vmalloc和堆栈内存。 68 69基于硬件标签的KASAN支持slab、page_alloc和不可执行的vmalloc内存。 70 71对于slab,两种软件KASAN模式都支持SLUB和SLAB分配器,而基于硬件标签的 72KASAN只支持SLUB。 73 74用法 75---- 76 77要启用KASAN,请使用以下命令配置内核:: 78 79 CONFIG_KASAN=y 80 81同时在 ``CONFIG_KASAN_GENERIC`` (启用通用KASAN模式), ``CONFIG_KASAN_SW_TAGS`` 82(启用基于硬件标签的KASAN模式),和 ``CONFIG_KASAN_HW_TAGS`` (启用基于硬件标签 83的KASAN模式)之间进行选择。 84 85对于软件模式,还可以在 ``CONFIG_KASAN_OUTLINE`` 和 ``CONFIG_KASAN_INLINE`` 86之间进行选择。outline和inline是编译器插桩类型。前者产生较小的二进制文件, 87而后者快2倍。 88 89要将受影响的slab对象的alloc和free堆栈跟踪包含到报告中,请启用 90``CONFIG_STACKTRACE`` 。要包括受影响物理页面的分配和释放堆栈跟踪的话, 91请启用 ``CONFIG_PAGE_OWNER`` 并使用 ``page_owner=on`` 进行引导。 92 93启动参数 94~~~~~~~~ 95 96KASAN受到通用 ``panic_on_warn`` 命令行参数的影响。当它被启用时,KASAN 97在打印出错误报告后会使内核恐慌。 98 99默认情况下,KASAN只对第一个无效的内存访问打印错误报告。使用 100``kasan_multi_shot``,KASAN对每一个无效的访问都打印一份报告。这会禁用 101了KASAN报告的 ``panic_on_warn``。 102 103另外,独立于 ``panic_on_warn`` 、 ``kasan.fault=`` boot参数可以用 104来控制恐慌和报告行为。 105 106- ``kasan.fault=report`` 或 ``=panic`` 控制是否只打印KASAN report或 107 同时使内核恐慌(默认: ``report`` )。即使 ``kasan_multi_shot`` 被 108 启用,恐慌也会发生。 109 110基于软件和硬件标签的KASAN模式(见下面关于各种模式的部分)支持改变堆栈跟 111踪收集行为: 112 113- ``kasan.stacktrace=off`` 或 ``=on`` 禁用或启用分配和释放堆栈痕 114 迹的收集(默认: ``on`` )。 115 116- ``kasan.stack_ring_size=<number of entries>`` 指定堆栈环的条 117 目数(默认: ``32768`` )。 118 119基于硬件标签的KASAN模式是为了在生产中作为一种安全缓解措施使用。因此,它 120支持额外的启动参数,允许完全禁用KASAN或控制其功能。 121 122- ``kasan=off`` 或 ``=on`` 控制KASAN是否被启用(默认: ``on`` )。 123 124- ``kasan.mode=sync``, ``=async`` or ``=asymm`` 控制KASAN是否 125 被配置为同步、异步或非对称的执行模式(默认: ``同步`` )。 126 同步模式:当标签检查异常发生时,会立即检测到不良访问。 127 异步模式:不良访问的检测是延迟的。当标签检查异常发生时,信息被存储在硬 128 件中(对于arm64来说是在TFSR_EL1寄存器中)。内核周期性地检查硬件,并\ 129 且只在这些检查中报告标签异常。 130 非对称模式:读取时同步检测不良访问,写入时异步检测。 131 132- ``kasan.vmalloc=off`` or ``=on`` 禁用或启用vmalloc分配的标记(默认: ``on`` )。 133 134错误报告 135~~~~~~~~ 136 137典型的KASAN报告如下所示:: 138 139 ================================================================== 140 BUG: KASAN: slab-out-of-bounds in kmalloc_oob_right+0xa8/0xbc [kasan_test] 141 Write of size 1 at addr ffff8801f44ec37b by task insmod/2760 142 143 CPU: 1 PID: 2760 Comm: insmod Not tainted 4.19.0-rc3+ #698 144 Hardware name: QEMU Standard PC (i440FX + PIIX, 1996), BIOS 1.10.2-1 04/01/2014 145 Call Trace: 146 dump_stack+0x94/0xd8 147 print_address_description+0x73/0x280 148 kasan_report+0x144/0x187 149 __asan_report_store1_noabort+0x17/0x20 150 kmalloc_oob_right+0xa8/0xbc [kasan_test] 151 kmalloc_tests_init+0x16/0x700 [kasan_test] 152 do_one_initcall+0xa5/0x3ae 153 do_init_module+0x1b6/0x547 154 load_module+0x75df/0x8070 155 __do_sys_init_module+0x1c6/0x200 156 __x64_sys_init_module+0x6e/0xb0 157 do_syscall_64+0x9f/0x2c0 158 entry_SYSCALL_64_after_hwframe+0x44/0xa9 159 RIP: 0033:0x7f96443109da 160 RSP: 002b:00007ffcf0b51b08 EFLAGS: 00000202 ORIG_RAX: 00000000000000af 161 RAX: ffffffffffffffda RBX: 000055dc3ee521a0 RCX: 00007f96443109da 162 RDX: 00007f96445cff88 RSI: 0000000000057a50 RDI: 00007f9644992000 163 RBP: 000055dc3ee510b0 R08: 0000000000000003 R09: 0000000000000000 164 R10: 00007f964430cd0a R11: 0000000000000202 R12: 00007f96445cff88 165 R13: 000055dc3ee51090 R14: 0000000000000000 R15: 0000000000000000 166 167 Allocated by task 2760: 168 save_stack+0x43/0xd0 169 kasan_kmalloc+0xa7/0xd0 170 kmem_cache_alloc_trace+0xe1/0x1b0 171 kmalloc_oob_right+0x56/0xbc [kasan_test] 172 kmalloc_tests_init+0x16/0x700 [kasan_test] 173 do_one_initcall+0xa5/0x3ae 174 do_init_module+0x1b6/0x547 175 load_module+0x75df/0x8070 176 __do_sys_init_module+0x1c6/0x200 177 __x64_sys_init_module+0x6e/0xb0 178 do_syscall_64+0x9f/0x2c0 179 entry_SYSCALL_64_after_hwframe+0x44/0xa9 180 181 Freed by task 815: 182 save_stack+0x43/0xd0 183 __kasan_slab_free+0x135/0x190 184 kasan_slab_free+0xe/0x10 185 kfree+0x93/0x1a0 186 umh_complete+0x6a/0xa0 187 call_usermodehelper_exec_async+0x4c3/0x640 188 ret_from_fork+0x35/0x40 189 190 The buggy address belongs to the object at ffff8801f44ec300 191 which belongs to the cache kmalloc-128 of size 128 192 The buggy address is located 123 bytes inside of 193 128-byte region [ffff8801f44ec300, ffff8801f44ec380) 194 The buggy address belongs to the page: 195 page:ffffea0007d13b00 count:1 mapcount:0 mapping:ffff8801f7001640 index:0x0 196 flags: 0x200000000000100(slab) 197 raw: 0200000000000100 ffffea0007d11dc0 0000001a0000001a ffff8801f7001640 198 raw: 0000000000000000 0000000080150015 00000001ffffffff 0000000000000000 199 page dumped because: kasan: bad access detected 200 201 Memory state around the buggy address: 202 ffff8801f44ec200: fc fc fc fc fc fc fc fc fb fb fb fb fb fb fb fb 203 ffff8801f44ec280: fb fb fb fb fb fb fb fb fc fc fc fc fc fc fc fc 204 >ffff8801f44ec300: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 03 205 ^ 206 ffff8801f44ec380: fc fc fc fc fc fc fc fc fb fb fb fb fb fb fb fb 207 ffff8801f44ec400: fb fb fb fb fb fb fb fb fc fc fc fc fc fc fc fc 208 ================================================================== 209 210报告标题总结了发生的错误类型以及导致该错误的访问类型。紧随其后的是错误访问的 211堆栈跟踪、所访问内存分配位置的堆栈跟踪(对于访问了slab对象的情况)以及对象 212被释放的位置的堆栈跟踪(对于访问已释放内存的问题报告)。接下来是对访问的 213slab对象的描述以及关于访问的内存页的信息。 214 215最后,报告展示了访问地址周围的内存状态。在内部,KASAN单独跟踪每个内存颗粒的 216内存状态,根据KASAN模式分为8或16个对齐字节。报告的内存状态部分中的每个数字 217都显示了围绕访问地址的其中一个内存颗粒的状态。 218 219对于通用KASAN,每个内存颗粒的大小为8个字节。每个颗粒的状态被编码在一个影子字节 220中。这8个字节可以是可访问的,部分访问的,已释放的或成为Redzone的一部分。KASAN 221对每个影子字节使用以下编码:00表示对应内存区域的所有8个字节都可以访问;数字N 222(1 <= N <= 7)表示前N个字节可访问,其他(8 - N)个字节不可访问;任何负值都表示 223无法访问整个8字节。KASAN使用不同的负值来区分不同类型的不可访问内存,如redzones 224或已释放的内存(参见 mm/kasan/kasan.h)。 225 226在上面的报告中,箭头指向影子字节 ``03`` ,表示访问的地址是部分可访问的。 227 228对于基于标签的KASAN模式,报告最后的部分显示了访问地址周围的内存标签 229(参考 `实施细则`_ 章节)。 230 231请注意,KASAN错误标题(如 ``slab-out-of-bounds`` 或 ``use-after-free`` ) 232是尽量接近的:KASAN根据其拥有的有限信息打印出最可能的错误类型。错误的实际类型 233可能会有所不同。 234 235通用KASAN还报告两个辅助调用堆栈跟踪。这些堆栈跟踪指向代码中与对象交互但不直接 236出现在错误访问堆栈跟踪中的位置。目前,这包括 call_rcu() 和排队的工作队列。 237 238CONFIG_KASAN_EXTRA_INFO 239~~~~~~~~~~~~~~~~~~~~~~~ 240 241启用 CONFIG_KASAN_EXTRA_INFO 选项允许 KASAN 记录和报告更多信息。目前支持的 242额外信息包括分配和释放时的 CPU 编号和时间戳。更多的信息可以帮助找到内核错误的原因, 243并将错误与其他系统事件关联起来,但代价是用额外的内存来记录更多信息(有关更多 244开销的细节,请参见 CONFIG_KASAN_EXTRA_INFO 选项的帮助文本)。 245 246以下为 CONFIG_KASAN_EXTRA_INFO 开启后的报告(仅显示不同部分):: 247 248 ================================================================== 249 ... 250 Allocated by task 134 on cpu 5 at 229.133855s: 251 ... 252 Freed by task 136 on cpu 3 at 230.199335s: 253 ... 254 ================================================================== 255 256实施细则 257-------- 258 259通用KASAN 260~~~~~~~~~ 261 262软件KASAN模式使用影子内存来记录每个内存字节是否可以安全访问,并使用编译时工具 263在每次内存访问之前插入影子内存检查。 264 265通用KASAN将1/8的内核内存专用于其影子内存(16TB以覆盖x86_64上的128TB),并使用 266具有比例和偏移量的直接映射将内存地址转换为其相应的影子地址。 267 268这是将地址转换为其相应影子地址的函数:: 269 270 static inline void *kasan_mem_to_shadow(const void *addr) 271 { 272 return (void *)((unsigned long)addr >> KASAN_SHADOW_SCALE_SHIFT) 273 + KASAN_SHADOW_OFFSET; 274 } 275 276在这里 ``KASAN_SHADOW_SCALE_SHIFT = 3`` 。 277 278编译时工具用于插入内存访问检查。编译器在每次访问大小为1、2、4、8或16的内存之前 279插入函数调用( ``__asan_load*(addr)`` , ``__asan_store*(addr)``)。这些函数通过 280检查相应的影子内存来检查内存访问是否有效。 281 282使用inline插桩,编译器不进行函数调用,而是直接插入代码来检查影子内存。此选项 283显著地增大了内核体积,但与outline插桩内核相比,它提供了x1.1-x2的性能提升。 284 285通用KASAN是唯一一种通过隔离延迟重新使用已释放对象的模式 286(参见 mm/kasan/quarantine.c 以了解实现)。 287 288基于软件标签的KASAN模式 289~~~~~~~~~~~~~~~~~~~~~~~ 290 291基于软件标签的KASAN使用软件内存标签方法来检查访问有效性。目前仅针对arm64架构实现。 292 293基于软件标签的KASAN使用arm64 CPU的顶部字节忽略(TBI)特性在内核指针的顶部字节中 294存储一个指针标签。它使用影子内存来存储与每个16字节内存单元相关的内存标签(因此, 295它将内核内存的1/16专用于影子内存)。 296 297在每次内存分配时,基于软件标签的KASAN都会生成一个随机标签,用这个标签标记分配 298的内存,并将相同的标签嵌入到返回的指针中。 299 300基于软件标签的KASAN使用编译时工具在每次内存访问之前插入检查。这些检查确保正在 301访问的内存的标签等于用于访问该内存的指针的标签。如果标签不匹配,基于软件标签 302的KASAN会打印错误报告。 303 304基于软件标签的KASAN也有两种插桩模式(outline,发出回调来检查内存访问;inline, 305执行内联的影子内存检查)。使用outline插桩模式,会从执行访问检查的函数打印错误 306报告。使用inline插桩,编译器会发出 ``brk`` 指令,并使用专用的 ``brk`` 处理程序 307来打印错误报告。 308 309基于软件标签的KASAN使用0xFF作为匹配所有指针标签(不检查通过带有0xFF指针标签 310的指针进行的访问)。值0xFE当前保留用于标记已释放的内存区域。 311 312 313基于硬件标签的KASAN模式 314~~~~~~~~~~~~~~~~~~~~~~~ 315 316基于硬件标签的KASAN在概念上类似于软件模式,但它是使用硬件内存标签作为支持而 317不是编译器插桩和影子内存。 318 319基于硬件标签的KASAN目前仅针对arm64架构实现,并且基于ARMv8.5指令集架构中引入 320的arm64内存标记扩展(MTE)和最高字节忽略(TBI)。 321 322特殊的arm64指令用于为每次内存分配指定内存标签。相同的标签被指定给指向这些分配 323的指针。在每次内存访问时,硬件确保正在访问的内存的标签等于用于访问该内存的指针 324的标签。如果标签不匹配,则会生成故障并打印报告。 325 326基于硬件标签的KASAN使用0xFF作为匹配所有指针标签(不检查通过带有0xFF指针标签的 327指针进行的访问)。值0xFE当前保留用于标记已释放的内存区域。 328 329如果硬件不支持MTE(ARMv8.5之前),则不会启用基于硬件标签的KASAN。在这种情况下, 330所有KASAN引导参数都将被忽略。 331 332请注意,启用CONFIG_KASAN_HW_TAGS始终会导致启用内核中的TBI。即使提供了 333``kasan.mode=off`` 或硬件不支持MTE(但支持TBI)。 334 335基于硬件标签的KASAN只报告第一个发现的错误。之后,MTE标签检查将被禁用。 336 337影子内存 338-------- 339 340本节的内容只适用于软件KASAN模式。 341 342内核将内存映射到地址空间的几个不同部分。内核虚拟地址的范围很大:没有足够的真实 343内存来支持内核可以访问的每个地址的真实影子区域。因此,KASAN只为地址空间的某些 344部分映射真实的影子。 345 346默认行为 347~~~~~~~~ 348 349默认情况下,体系结构仅将实际内存映射到用于线性映射的阴影区域(以及可能的其他 350小区域)。对于所有其他区域 —— 例如vmalloc和vmemmap空间 —— 一个只读页面被映射 351到阴影区域上。这个只读的影子页面声明所有内存访问都是允许的。 352 353这给模块带来了一个问题:它们不存在于线性映射中,而是存在于专用的模块空间中。 354通过连接模块分配器,KASAN临时映射真实的影子内存以覆盖它们。例如,这允许检测 355对模块全局变量的无效访问。 356 357这也造成了与 ``VMAP_STACK`` 的不兼容:如果堆栈位于vmalloc空间中,它将被分配 358只读页面的影子内存,并且内核在尝试为堆栈变量设置影子数据时会出错。 359 360CONFIG_KASAN_VMALLOC 361~~~~~~~~~~~~~~~~~~~~ 362 363使用 ``CONFIG_KASAN_VMALLOC`` ,KASAN可以以更大的内存使用为代价覆盖vmalloc 364空间。目前,这在arm64、x86、riscv、s390和powerpc上受支持。 365 366这通过连接到vmalloc和vmap并动态分配真实的影子内存来支持映射。 367 368vmalloc空间中的大多数映射都很小,需要不到一整页的阴影空间。因此,为每个映射 369分配一个完整的影子页面将是一种浪费。此外,为了确保不同的映射使用不同的影子 370页面,映射必须与 ``KASAN_GRANULE_SIZE * PAGE_SIZE`` 对齐。 371 372相反,KASAN跨多个映射共享后备空间。当vmalloc空间中的映射使用影子区域的特定 373页面时,它会分配一个后备页面。此页面稍后可以由其他vmalloc映射共享。 374 375KASAN连接到vmap基础架构以懒清理未使用的影子内存。 376 377为了避免交换映射的困难,KASAN预测覆盖vmalloc空间的阴影区域部分将不会被早期 378的阴影页面覆盖,但是将不会被映射。这将需要更改特定于arch的代码。 379 380这允许在x86上支持 ``VMAP_STACK`` ,并且可以简化对没有固定模块区域的架构的支持。 381 382对于开发者 383---------- 384 385忽略访问 386~~~~~~~~ 387 388软件KASAN模式使用编译器插桩来插入有效性检查。此类检测可能与内核的某些部分 389不兼容,因此需要禁用。 390 391内核的其他部分可能会访问已分配对象的元数据。通常,KASAN会检测并报告此类访问, 392但在某些情况下(例如,在内存分配器中),这些访问是有效的。 393 394对于软件KASAN模式,要禁用特定文件或目录的检测,请将 ``KASAN_SANITIZE`` 添加 395到相应的内核Makefile中: 396 397- 对于单个文件(例如,main.o):: 398 399 KASAN_SANITIZE_main.o := n 400 401- 对于一个目录下的所有文件:: 402 403 KASAN_SANITIZE := n 404 405对于软件KASAN模式,要在每个函数的基础上禁用检测,请使用KASAN特定的 406``__no_sanitize_address`` 函数属性或通用的 ``noinstr`` 。 407 408请注意,禁用编译器插桩(基于每个文件或每个函数)会使KASAN忽略在软件KASAN模式 409的代码中直接发生的访问。当访问是间接发生的(通过调用检测函数)或使用没有编译器 410插桩的基于硬件标签的模式时,它没有帮助。 411 412对于软件KASAN模式,要在当前任务的一部分内核代码中禁用KASAN报告,请使用 413``kasan_disable_current()``/``kasan_enable_current()`` 部分注释这部分代码。 414这也会禁用通过函数调用发生的间接访问的报告。 415 416对于基于标签的KASAN模式,要禁用访问检查,请使用 ``kasan_reset_tag()`` 或 417``page_kasan_tag_reset()`` 。请注意,通过 ``page_kasan_tag_reset()`` 418临时禁用访问检查需要通过 ``page_kasan_tag`` / ``page_kasan_tag_set`` 保 419存和恢复每页KASAN标签。 420 421测试 422~~~~ 423 424有一些KASAN测试可以验证KASAN是否正常工作并可以检测某些类型的内存损坏。 425 426所有 KASAN 测试都与 KUnit 测试框架集成,可通过 ``CONFIG_KASAN_KUNIT_TEST`` 启用。 427测试可以通过几种不同的方式自动运行和部分验证;请参阅以下说明。 428 429如果检测到错误,每个 KASAN 测试都会打印多份 KASAN 报告中的一份。 430然后测试会打印其编号和状态。 431 432当测试通过:: 433 434 ok 28 - kmalloc_double_kzfree 435 436当由于 ``kmalloc`` 失败而导致测试失败时:: 437 438 # kmalloc_large_oob_right: ASSERTION FAILED at mm/kasan/kasan_test.c:245 439 Expected ptr is not null, but is 440 not ok 5 - kmalloc_large_oob_right 441 442当由于缺少KASAN报告而导致测试失败时:: 443 444 # kmalloc_double_kzfree: EXPECTATION FAILED at mm/kasan/kasan_test.c:709 445 KASAN failure expected in "kfree_sensitive(ptr)", but none occurred 446 not ok 28 - kmalloc_double_kzfree 447 448 449最后打印所有KASAN测试的累积状态。成功:: 450 451 ok 1 - kasan 452 453或者,如果其中一项测试失败:: 454 455 not ok 1 - kasan 456 457有几种方法可以运行 KASAN 测试。 458 4591. 可加载模块 460 461 启用 ``CONFIG_KUNIT`` 后,可以将测试构建为可加载模块 462 并通过使用 ``insmod`` 或 ``modprobe`` 加载 ``kasan_test.ko`` 来运行。 463 4642. 内置 465 466 通过内置 ``CONFIG_KUNIT``,测试也可以内置。 467 测试将在启动时作为后期初始化调用运行。 468 4693. 使用kunit_tool 470 471 通过内置 ``CONFIG_KUNIT`` 和 ``CONFIG_KASAN_KUNIT_TEST`` ,还可以使用 472 ``kunit_tool`` 以更易读的方式查看KUnit测试结果。这不会打印通过测试 473 的KASAN报告。有关 ``kunit_tool`` 更多最新信息,请参阅 474 `KUnit文档 <https://www.kernel.org/doc/html/latest/dev-tools/kunit/index.html>`_ 。 475 476.. _KUnit: https://www.kernel.org/doc/html/latest/dev-tools/kunit/index.html 477