TransMode#
产品支持情况#
产品 |
是否支持 |
|---|---|
Ascend 950PR/Ascend 950DT |
√ |
功能说明#
在matmul的输入输出矩阵均为FP32数据类型的场景下,设置是否使能TF32计算以及使能TF32的舍入模式。使能后,在矩阵乘计算时,FP32数据类型会转换为TF32数据类型。
TF32采用1个符号位,8个指数位,10个尾数位,总共19位进行计算。更少的尾数位减少硬件计算量,加速计算,但同时也会带来精度损失。
输入数据格式仍然为FP32,通过TransMode参数来确定舍入模式,一般情况采用CAST_ROUND(舍入到最近整数,中间值远离零)模式。
原型定义#
class TransMode(enum.Enum):
CAST_NONE = ... # 不使能float数据类型转换为TF32数据类型
CAST_RINT = ... # 舍入到最近整数,中间值时舍入到偶数
CAST_ROUND = ... # 舍入到最近整数,中间值时远离零舍入