pypto.set_runtime_options#

产品支持情况#

产品

是否支持

Atlas A3 训练系列产品/Atlas A3 推理系列产品

Atlas A2 训练系列产品/Atlas A2 推理系列产品

功能说明#

设置runtime的选项。

函数原型#

set_runtime_options(*,
                    device_sched_mode : int = None,
                    stitch_function_max_num : int = None,
                    run_mode : int = None,
                    valid_shape_optimize : int = None,
                    ) -> None

参数说明#

参数名

输入/输出

说明

device_sched_mode

输入

含义:设置计算子图的调度模式
说明:0:代表默认调度模式,ready子图放入共享队列,各个调度线程抢占子图进行发送,子图获取发送遵循先入先出;
1:代表L2cache亲和调度模式,选择最新依赖ready的子图优先下发,达到复用L2cache的效果;
2:公平调度模式,aicpu上多线程调度管理多个aicore的时候,下发子图会尽量控制在多线程间的公平性,此模式会带来额外的调度管理开销;
3:代表同时开启L2cache亲和调度模式以及公平调度模式;
类型:int
取值范围:0 或 1 或 2 或 3
默认值:0
影响pass范围:NA

stitch_function_max_num

输入

含义:machine运行时ctrlflow aicpu里控制每次提交给schedule aicpu处理的最大device task的计算任务量
说明:设置的值代表每一个stitch task里处理的最大loop个数,该数值越大,通常stitch batch内并行度越高,相应的workspace内存使用也越大。
注意:此项配置会替代掉stitch_function_inner_memory、stitch_function_outcast_memory和stitch_function_num_initial三项。
类型:int
取值范围:1 ~ 1024
默认值:128
影响pass范围:NA

run_mode

输入

含义:设置计算子图的执行设备
说明:
0:表示在NPU上执行
1:表示在模拟器上执行
类型:int
取值范围:0或者1
默认值:根据是否设置cann的环境变量来决定。如果设置了环境变量,则在NPU上执行;否则在模拟器上执行
影响pass范围:NA

valid_shape_optimize

输入

含义:动态shape场景,validshape编译优化选项,打开该选项后,动态轴的Loop循环中,主块(shape与validshape相等)采用静态shape编译,尾块采用动态shape编译
说明:
0:默认值,表示关闭validshape编译优化选项,所有Loop循环均采用动态shape进行编译
1:表示打开validshape编译优化选项
类型:int
取值范围:0或者1
默认值:0
影响pass范围:NA

ready_on_host_tensors

输入

含义:标记在Host端准备好的Kernel入口函数的输入tensor名称列表,格式为[“tensor1”, “tensor2”, …]。
说明:如果算子的计算逻辑对某输入tensor有值依赖(即获取了tensor的值),且此tensor的device数据在Host端已提前准备好,那么cpu的控制流可以提前发射以提升性能。
类型:list of string
默认值:空列表
影响pass范围:NA

返回值说明#

void:Set方法无返回值。设置操作成功即生效。

约束说明#

在JIT外部使用set_runtime_options配置,在JIT执行时并不生效,会恢复成默认配置;在JIT装饰其内配置runtime_options,配置正常生效。

调用示例#

pypto.set_runtime_options(device_sched_mode=2,
                          stitch_function_max_num=256)
@pypto.frontend.jit(
        runtime_options={
        "stitch_function_max_num": 128,
        "device_sched_mode": 1
        }
)

最终JIT内配置项生效的结果是:stitch_function_max_num=128; device_sched_mode=1。