TransMode#

产品支持情况#

产品

是否支持

Ascend 950PR/Ascend 950DT

功能说明#

在matmul的输入输出矩阵均为FP32数据类型的场景下,设置是否使能TF32计算以及使能TF32的舍入模式。使能后,在矩阵乘计算时,FP32数据类型会转换为TF32数据类型。
TF32采用1个符号位,8个指数位,10个尾数位,总共19位进行计算。更少的尾数位减少硬件计算量,加速计算,但同时也会带来精度损失。
输入数据格式仍然为FP32,通过TransMode参数来确定舍入模式,一般情况采用CAST_ROUND(舍入到最近整数,中间值远离零)模式。

原型定义#

class TransMode(enum.Enum):
     CAST_NONE = ...   # 不使能float数据类型转换为TF32数据类型
     CAST_RINT = ...   # 舍入到最近整数,中间值时舍入到偶数
     CAST_ROUND = ...  # 舍入到最近整数,中间值时远离零舍入