xref: /linux/Documentation/translations/zh_CN/mm/ksm.rst (revision ee65728e103bb7dd99d8604bf6c7aa89c7d7e446)
1*ee65728eSMike Rapoport.. include:: ../disclaimer-zh_CN.rst
2*ee65728eSMike Rapoport
3*ee65728eSMike Rapoport:Original: Documentation/mm/ksm.rst
4*ee65728eSMike Rapoport
5*ee65728eSMike Rapoport:翻译:
6*ee65728eSMike Rapoport
7*ee65728eSMike Rapoport   徐鑫 xu xin <xu.xin16@zte.com.cn>
8*ee65728eSMike Rapoport
9*ee65728eSMike Rapoport============
10*ee65728eSMike Rapoport内核同页合并
11*ee65728eSMike Rapoport============
12*ee65728eSMike Rapoport
13*ee65728eSMike RapoportKSM 是一种节省内存的数据去重功能,由CONFIG_KSM=y启用,并在2.6.32版本时被添加
14*ee65728eSMike Rapoport到Linux内核。详见 ``mm/ksm.c`` 的实现,以及http://lwn.net/Articles/30670415*ee65728eSMike Rapoporthttps://lwn.net/Articles/330589
16*ee65728eSMike Rapoport
17*ee65728eSMike RapoportKSM的用户空间的接口在Documentation/translations/zh_CN/admin-guide/mm/ksm.rst
18*ee65728eSMike Rapoport文档中有描述。
19*ee65728eSMike Rapoport
20*ee65728eSMike Rapoport设计
21*ee65728eSMike Rapoport====
22*ee65728eSMike Rapoport
23*ee65728eSMike Rapoport概述
24*ee65728eSMike Rapoport----
25*ee65728eSMike Rapoport
26*ee65728eSMike Rapoport概述内容请见mm/ksm.c文档中的“DOC: Overview”
27*ee65728eSMike Rapoport
28*ee65728eSMike Rapoport逆映射
29*ee65728eSMike Rapoport------
30*ee65728eSMike RapoportKSM维护着稳定树中的KSM页的逆映射信息。
31*ee65728eSMike Rapoport
32*ee65728eSMike Rapoport当KSM页面的共享数小于 ``max_page_sharing`` 的虚拟内存区域(VMAs)时,则代表了
33*ee65728eSMike RapoportKSM页的稳定树其中的节点指向了一个rmap_item结构体类型的列表。同时,这个KSM页
34*ee65728eSMike Rapoport的 ``page->mapping`` 指向了该稳定树节点。
35*ee65728eSMike Rapoport
36*ee65728eSMike Rapoport如果共享数超过了阈值,KSM将给稳定树添加第二个维度。稳定树就变成链接一个或多
37*ee65728eSMike Rapoport个稳定树"副本"的"链"。每个副本都保留KSM页的逆映射信息,其中 ``page->mapping``
38*ee65728eSMike Rapoport指向该"副本"。
39*ee65728eSMike Rapoport
40*ee65728eSMike Rapoport每个链以及链接到该链中的所有"副本"强制不变的是,它们代表了相同的写保护内存
41*ee65728eSMike Rapoport内容,尽管任中一个"副本"是由同一片内存区的不同的KSM复制页所指向的。
42*ee65728eSMike Rapoport
43*ee65728eSMike Rapoport这样一来,相比与无限的逆映射链表,稳定树的查找计算复杂性不受影响。但在稳定树
44*ee65728eSMike Rapoport本身中不能有重复的KSM页面内容仍然是强制要求。
45*ee65728eSMike Rapoport
46*ee65728eSMike Rapoport由 ``max_page_sharing`` 强制决定的数据去重限制是必要的,以此来避免虚拟内存
47*ee65728eSMike Rapoportrmap链表变得过大。rmap的遍历具有O(N)的复杂度,其中N是共享页面的rmap_项(即
48*ee65728eSMike Rapoport虚拟映射)的数量,而这个共享页面的节点数量又被 ``max_page_sharing`` 所限制。
49*ee65728eSMike Rapoport因此,这有效地将线性O(N)计算复杂度从rmap遍历中分散到不同的KSM页面上。ksmd进
50*ee65728eSMike Rapoport程在稳定节点"链"上的遍历也是O(N),但这个N是稳定树"副本"的数量,而不是rmap项
51*ee65728eSMike Rapoport的数量,因此它对ksmd性能没有显著影响。实际上,最佳稳定树"副本"的候选节点将
52*ee65728eSMike Rapoport保留在"副本"列表的开头。
53*ee65728eSMike Rapoport
54*ee65728eSMike Rapoport``max_page_sharing`` 的值设置得高了会促使更快的内存合并(因为将有更少的稳定
55*ee65728eSMike Rapoport树副本排队进入稳定节点chain->hlist)和更高的数据去重系数,但代价是在交换、压
56*ee65728eSMike Rapoport缩、NUMA平衡和页面迁移过程中可能导致KSM页的最大rmap遍历速度较慢。
57*ee65728eSMike Rapoport
58*ee65728eSMike Rapoport``stable_node_dups/stable_node_chains`` 的比值还受 ``max_page_sharing`` 调控
59*ee65728eSMike Rapoport的影响,高比值可能意味着稳定节点dup中存在碎片,这可以通过在ksmd中引入碎片算
60*ee65728eSMike Rapoport法来解决,该算法将rmap项从一个稳定节点dup重定位到另一个稳定节点dup,以便释放
61*ee65728eSMike Rapoport那些仅包含极少rmap项的稳定节点"dup",但这可能会增加ksmd进程的CPU使用率,并可
62*ee65728eSMike Rapoport能会减慢应用程序在KSM页面上的只读计算。
63*ee65728eSMike Rapoport
64*ee65728eSMike RapoportKSM会定期扫描稳定节点"链"中链接的所有稳定树"副本",以便删减过时了的稳定节点。
65*ee65728eSMike Rapoport这种扫描的频率由 ``stable_node_chains_prune_millisecs`` 这个sysfs 接口定义。
66*ee65728eSMike Rapoport
67*ee65728eSMike Rapoport参考
68*ee65728eSMike Rapoport====
69*ee65728eSMike Rapoport内核代码请见mm/ksm.c70*ee65728eSMike Rapoport涉及的函数(mm_slot  ksm_scan  stable_node  rmap_item)。
71