1339cf5a2STang Yizhou.. SPDX-License-Identifier: GPL-2.0 2339cf5a2STang Yizhou.. include:: ../disclaimer-zh_CN.rst 3339cf5a2STang Yizhou 4339cf5a2STang Yizhou:Original: Documentation/power/energy-model.rst 5339cf5a2STang Yizhou 6339cf5a2STang Yizhou:翻译: 7339cf5a2STang Yizhou 8339cf5a2STang Yizhou 唐艺舟 Tang Yizhou <tangyeechou@gmail.com> 9339cf5a2STang Yizhou 10339cf5a2STang Yizhou============ 11339cf5a2STang Yizhou设备能量模型 12339cf5a2STang Yizhou============ 13339cf5a2STang Yizhou 14339cf5a2STang Yizhou1. 概述 15339cf5a2STang Yizhou------- 16339cf5a2STang Yizhou 17339cf5a2STang Yizhou能量模型(EM)框架是一种驱动程序与内核子系统之间的接口。其中驱动程序了解不同 18339cf5a2STang Yizhou性能层级的设备所消耗的功率,而内核子系统愿意使用该信息做出能量感知决策。 19339cf5a2STang Yizhou 20339cf5a2STang Yizhou设备所消耗的功率的信息来源在不同的平台上可能有很大的不同。这些功率成本在某些 21339cf5a2STang Yizhou情况下可以使用设备树数据来估算。在其它情况下,固件会更清楚。或者,用户空间可能 22339cf5a2STang Yizhou是最清楚的。以此类推。为了避免每一个客户端子系统对每一种可能的信息源自己重新 23339cf5a2STang Yizhou实现支持,EM框架作为一个抽象层介入,它在内核中对功率成本表的格式进行标准化, 24339cf5a2STang Yizhou因此能够避免多余的工作。 25339cf5a2STang Yizhou 26*7df047beSYanteng Si功率值可以用微瓦或“抽象刻度”表示。多个子系统可能使用EM,由系统集成商来检查 27339cf5a2STang Yizhou功率值刻度类型的要求是否满足。可以在能量感知调度器的文档中找到一个例子 28339cf5a2STang YizhouDocumentation/scheduler/sched-energy.rst。对于一些子系统,比如热能或 29339cf5a2STang Yizhoupowercap,用“抽象刻度”描述功率值可能会导致问题。这些子系统对过去使用的功率的 30*7df047beSYanteng Si估算值更感兴趣,因此可能需要真实的微瓦。这些要求的一个例子可以在智能功率分配 31339cf5a2STang YizhouDocumentation/driver-api/thermal/power_allocator.rst文档中找到。 32339cf5a2STang Yizhou 33339cf5a2STang Yizhou内核子系统可能(基于EM内部标志位)实现了对EM注册设备是否具有不一致刻度的自动 34*7df047beSYanteng Si检查。要记住的重要事情是,当功率值以“抽象刻度”表示时,从中推导以微焦耳为单位 35339cf5a2STang Yizhou的真实能量消耗是不可能的。 36339cf5a2STang Yizhou 37339cf5a2STang Yizhou下图描述了一个驱动的例子(这里是针对Arm的,但该方法适用于任何体系结构),它 38339cf5a2STang Yizhou向EM框架提供了功率成本,感兴趣的客户端可从中读取数据:: 39339cf5a2STang Yizhou 40339cf5a2STang Yizhou +---------------+ +-----------------+ +---------------+ 41339cf5a2STang Yizhou | Thermal (IPA) | | Scheduler (EAS) | | Other | 42339cf5a2STang Yizhou +---------------+ +-----------------+ +---------------+ 43339cf5a2STang Yizhou | | em_cpu_energy() | 44339cf5a2STang Yizhou | | em_cpu_get() | 45339cf5a2STang Yizhou +---------+ | +---------+ 46339cf5a2STang Yizhou | | | 47339cf5a2STang Yizhou v v v 48339cf5a2STang Yizhou +---------------------+ 49339cf5a2STang Yizhou | Energy Model | 50339cf5a2STang Yizhou | Framework | 51339cf5a2STang Yizhou +---------------------+ 52339cf5a2STang Yizhou ^ ^ ^ 53339cf5a2STang Yizhou | | | em_dev_register_perf_domain() 54339cf5a2STang Yizhou +----------+ | +---------+ 55339cf5a2STang Yizhou | | | 56339cf5a2STang Yizhou +---------------+ +---------------+ +--------------+ 57339cf5a2STang Yizhou | cpufreq-dt | | arm_scmi | | Other | 58339cf5a2STang Yizhou +---------------+ +---------------+ +--------------+ 59339cf5a2STang Yizhou ^ ^ ^ 60339cf5a2STang Yizhou | | | 61339cf5a2STang Yizhou +--------------+ +---------------+ +--------------+ 62339cf5a2STang Yizhou | Device Tree | | Firmware | | ? | 63339cf5a2STang Yizhou +--------------+ +---------------+ +--------------+ 64339cf5a2STang Yizhou 65339cf5a2STang Yizhou对于CPU设备,EM框架管理着系统中每个“性能域”的功率成本表。一个性能域是一组 66339cf5a2STang Yizhou性能一起伸缩的CPU。性能域通常与CPUFreq策略具有1对1映射。一个性能域中的 67339cf5a2STang Yizhou所有CPU要求具有相同的微架构。不同性能域中的CPU可以有不同的微架构。 68339cf5a2STang Yizhou 69339cf5a2STang Yizhou 70339cf5a2STang Yizhou2. 核心API 71339cf5a2STang Yizhou---------- 72339cf5a2STang Yizhou 73339cf5a2STang Yizhou2.1 配置选项 74339cf5a2STang Yizhou^^^^^^^^^^^^ 75339cf5a2STang Yizhou 76339cf5a2STang Yizhou必须使能CONFIG_ENERGY_MODEL才能使用EM框架。 77339cf5a2STang Yizhou 78339cf5a2STang Yizhou 79339cf5a2STang Yizhou2.2 性能域的注册 80339cf5a2STang Yizhou^^^^^^^^^^^^^^^^ 81339cf5a2STang Yizhou 82339cf5a2STang Yizhou“高级”EM的注册 83339cf5a2STang Yizhou~~~~~~~~~~~~~~~~ 84339cf5a2STang Yizhou 85339cf5a2STang Yizhou“高级”EM因它允许驱动提供更精确的功率模型而得名。它并不受限于框架中的一些已 86339cf5a2STang Yizhou实现的数学公式(就像“简单”EM那样)。它可以更好地反映每个性能状态的实际功率 87339cf5a2STang Yizhou测量。因此,在EM静态功率(漏电流功率)是重要的情况下,应该首选这种注册方式。 88339cf5a2STang Yizhou 89339cf5a2STang Yizhou驱动程序应通过以下API将性能域注册到EM框架中:: 90339cf5a2STang Yizhou 91339cf5a2STang Yizhou int em_dev_register_perf_domain(struct device *dev, unsigned int nr_states, 92*7df047beSYanteng Si struct em_data_callback *cb, cpumask_t *cpus, bool microwatts); 93339cf5a2STang Yizhou 94339cf5a2STang Yizhou驱动程序必须提供一个回调函数,为每个性能状态返回<频率,功率>元组。驱动程序 95339cf5a2STang Yizhou提供的回调函数可以自由地从任何相关位置(DT、固件......)以及以任何被认为是 96339cf5a2STang Yizhou必要的方式获取数据。只有对于CPU设备,驱动程序必须使用cpumask指定性能域的CPU。 97339cf5a2STang Yizhou对于CPU以外的其他设备,最后一个参数必须被设置为NULL。 98339cf5a2STang Yizhou 99*7df047beSYanteng Si最后一个参数“microwatts”(微瓦)设置成正确的值是很重要的,使用EM的内核 100339cf5a2STang Yizhou子系统可能会依赖这个标志来检查所有的EM设备是否使用相同的刻度。如果有不同的 101*7df047beSYanteng Si刻度,这些子系统可能决定返回警告/错误,停止工作或崩溃(panic)。 102339cf5a2STang Yizhou 103339cf5a2STang Yizhou关于实现这个回调函数的驱动程序的例子,参见第3节。或者在第2.4节阅读这个API 104339cf5a2STang Yizhou的更多文档。 105339cf5a2STang Yizhou 106*7df047beSYanteng Si使用DT的EM注册 107*7df047beSYanteng Si============== 108*7df047beSYanteng Si 109*7df047beSYanteng SiEM也可以使用OPP框架和DT "操作点-v2 "中的信息注册。DT中的每个OPP条目都可 110*7df047beSYanteng Si以用一个包含微瓦特功率值的属性 "op-microwatt "来扩展。这个OPP DT属性允 111*7df047beSYanteng Si许平台注册反映总功率(静态+动态)的EM功率值。这些功率值可能直接来自实验和 112*7df047beSYanteng Si测量。 113*7df047beSYanteng Si 114*7df047beSYanteng Si“人工”EM的注册 115*7df047beSYanteng Si============== 116*7df047beSYanteng Si 117*7df047beSYanteng Si有一个选项可以为缺少关于每个性能状态的功率值的详细知识的驱动程序提供一个自 118*7df047beSYanteng Si定义回调。回调.get_cost()是可选的,它提供EAS使用的“成本”值。这对那些只提 119*7df047beSYanteng Si供CPU类型之间相对效率信息的平台很有用,人们可以利用这些信息来创建一个抽象的 120*7df047beSYanteng Si功率模型。但是,考虑到输入功率值的大小限制,即使是抽象的功率模型有时也很难装 121*7df047beSYanteng Si进去。.get_cost()允许提供反映CPU效率的“成本”值。这将允许提供EAS信息,它 122*7df047beSYanteng Si与EM内部计算'成本'值的公式有不同的关系。要为这样的平台注册EM,驱动程序必须 123*7df047beSYanteng Si将标志“microwatts”设置为0,提供.get_power()回调和.get_cost()回调。EM 124*7df047beSYanteng Si框架会在注册过程中正确处理这样的平台。这种平台会被设置EM_PERF_DOMAIN_ARTIFICIAL 125*7df047beSYanteng Si标志。其他使用EM的框架应该特别注意测试和正确对待这个标志。 126339cf5a2STang Yizhou 127339cf5a2STang Yizhou“简单”EM的注册 128339cf5a2STang Yizhou~~~~~~~~~~~~~~~~ 129339cf5a2STang Yizhou 130339cf5a2STang Yizhou“简单”EM是用框架的辅助函数cpufreq_register_em_with_opp()注册的。它实现了 131339cf5a2STang Yizhou一个和以下数学公式紧密相关的功率模型:: 132339cf5a2STang Yizhou 133339cf5a2STang Yizhou Power = C * V^2 * f 134339cf5a2STang Yizhou 135339cf5a2STang Yizhou使用这种方法注册的EM可能无法正确反映真实设备的物理特性,例如当静态功率 136339cf5a2STang Yizhou(漏电流功率)很重要时。 137339cf5a2STang Yizhou 138339cf5a2STang Yizhou 139339cf5a2STang Yizhou2.3 访问性能域 140339cf5a2STang Yizhou^^^^^^^^^^^^^^ 141339cf5a2STang Yizhou 142339cf5a2STang Yizhou有两个API函数提供对能量模型的访问。em_cpu_get()以CPU id为参数,em_pd_get() 143339cf5a2STang Yizhou以设备指针为参数。使用哪个接口取决于子系统,但对于CPU设备来说,这两个函数都返 144339cf5a2STang Yizhou回相同的性能域。 145339cf5a2STang Yizhou 146339cf5a2STang Yizhou对CPU的能量模型感兴趣的子系统可以通过em_cpu_get() API检索它。在创建性能域时 147339cf5a2STang Yizhou分配一次能量模型表,它保存在内存中不被修改。 148339cf5a2STang Yizhou 149339cf5a2STang Yizhou一个性能域所消耗的能量可以使用em_cpu_energy() API来估算。该估算假定CPU设备 150339cf5a2STang Yizhou使用的CPUfreq监管器是schedutil。当前该计算不能提供给其它类型的设备。 151339cf5a2STang Yizhou 152339cf5a2STang Yizhou关于上述API的更多细节可以在 ``<linux/energy_model.h>`` 或第2.4节中找到。 153339cf5a2STang Yizhou 154339cf5a2STang Yizhou 155339cf5a2STang Yizhou2.4 API的细节描述 156339cf5a2STang Yizhou^^^^^^^^^^^^^^^^^ 157339cf5a2STang Yizhou参见 include/linux/energy_model.h 和 kernel/power/energy_model.c 的kernel doc。 158339cf5a2STang Yizhou 159339cf5a2STang Yizhou3. 驱动示例 160339cf5a2STang Yizhou----------- 161339cf5a2STang Yizhou 162339cf5a2STang YizhouCPUFreq框架支持专用的回调函数,用于为指定的CPU(们)注册EM: 163339cf5a2STang Yizhoucpufreq_driver::register_em()。这个回调必须为每个特定的驱动程序正确实现, 164339cf5a2STang Yizhou因为框架会在设置过程中适时地调用它。本节提供了一个简单的例子,展示CPUFreq驱动 165339cf5a2STang Yizhou在能量模型框架中使用(假的)“foo”协议注册性能域。该驱动实现了一个est_power() 166339cf5a2STang Yizhou函数提供给EM框架:: 167339cf5a2STang Yizhou 168339cf5a2STang Yizhou -> drivers/cpufreq/foo_cpufreq.c 169339cf5a2STang Yizhou 170*7df047beSYanteng Si 01 static int est_power(struct device *dev, unsigned long *mW, 171*7df047beSYanteng Si 02 unsigned long *KHz) 172339cf5a2STang Yizhou 03 { 173339cf5a2STang Yizhou 04 long freq, power; 174339cf5a2STang Yizhou 05 175339cf5a2STang Yizhou 06 /* 使用“foo”协议设置频率上限 */ 176339cf5a2STang Yizhou 07 freq = foo_get_freq_ceil(dev, *KHz); 177339cf5a2STang Yizhou 08 if (freq < 0); 178339cf5a2STang Yizhou 09 return freq; 179339cf5a2STang Yizhou 10 180339cf5a2STang Yizhou 11 /* 估算相关频率下设备的功率成本 */ 181339cf5a2STang Yizhou 12 power = foo_estimate_power(dev, freq); 182339cf5a2STang Yizhou 13 if (power < 0); 183339cf5a2STang Yizhou 14 return power; 184339cf5a2STang Yizhou 15 185339cf5a2STang Yizhou 16 /* 将这些值返回给EM框架 */ 186339cf5a2STang Yizhou 17 *mW = power; 187339cf5a2STang Yizhou 18 *KHz = freq; 188339cf5a2STang Yizhou 19 189339cf5a2STang Yizhou 20 return 0; 190339cf5a2STang Yizhou 21 } 191339cf5a2STang Yizhou 22 192339cf5a2STang Yizhou 23 static void foo_cpufreq_register_em(struct cpufreq_policy *policy) 193339cf5a2STang Yizhou 24 { 194339cf5a2STang Yizhou 25 struct em_data_callback em_cb = EM_DATA_CB(est_power); 195339cf5a2STang Yizhou 26 struct device *cpu_dev; 196339cf5a2STang Yizhou 27 int nr_opp; 197339cf5a2STang Yizhou 28 198339cf5a2STang Yizhou 29 cpu_dev = get_cpu_device(cpumask_first(policy->cpus)); 199339cf5a2STang Yizhou 30 200339cf5a2STang Yizhou 31 /* 查找该策略支持的OPP数量 */ 201339cf5a2STang Yizhou 32 nr_opp = foo_get_nr_opp(policy); 202339cf5a2STang Yizhou 33 203339cf5a2STang Yizhou 34 /* 并注册新的性能域 */ 204339cf5a2STang Yizhou 35 em_dev_register_perf_domain(cpu_dev, nr_opp, &em_cb, policy->cpus, 205339cf5a2STang Yizhou 36 true); 206339cf5a2STang Yizhou 37 } 207339cf5a2STang Yizhou 38 208339cf5a2STang Yizhou 39 static struct cpufreq_driver foo_cpufreq_driver = { 209339cf5a2STang Yizhou 40 .register_em = foo_cpufreq_register_em, 210339cf5a2STang Yizhou 41 }; 211