VERIFY 组件错误码#

范围：FBXXXX
本文档说明 VERIFY 组件的错误码定义、场景说明与排查建议。

错误码定义#

相关错误码的枚举与码值统一定义在 framework/include/tilefwk/error_code.h（含 VERIFY 相关枚举及 Calculator 层的 CalculatorErrorScene 等）。

排查建议#

典型错误码场景#

该场景涉及的错误码属于精度工具组件功能的一部分，出现这些错误码，精度工具仍然在正常发挥作用，用户可结合一下排查建议自行开展精度问题定位：

错误码：0xB4001U：VERIFY_RESULT_MISMATCH#

日志示例#

该场景为精度校验失败场景，同时会伴随如下输出：

[ERROR] PYPTO(1535746):2026-03-20 09:43:12.887 [flow_verifier.cpp:105][VERIFY]:ErrCode: FB4001! tensor_graph Verify for 1 data view list index 0 result FAILED
[INFO ] PYPTO(1535746):2026-03-20 09:43:12.887 [flow_verifier.h:151][VERIFY]:
    Error rtol=0.001000 atol=0.001000 index:0 golden:10 output:1 absDiff:9 relDiff:1.63636
    Error rtol=0.001000 atol=0.001000 index:1 golden:10 output:1 absDiff:9 relDiff:1.63636
    Error rtol=0.001000 atol=0.001000 index:2 golden:10 output:1 absDiff:9 relDiff:1.63636
    Error rtol=0.001000 atol=0.001000 index:3 golden:10 output:1 absDiff:9 relDiff:1.63636
    Error rtol=0.001000 atol=0.001000 index:4 golden:10 output:1 absDiff:9 relDiff:1.63636
    Error rtol=0.001000 atol=0.001000 index:5 golden:10 output:1 absDiff:9 relDiff:1.63636
  All size:256 failNum:256 maxAbsDiff:9 maxRelDiff:1.63636 averageAbsDiff:9 averageRelDiff:1.63636 errorCount:256 errorRatio:1 zeroCount:0 zeroRatio:0
  maxAbs-> index:0 golden:10 output:1 absDiff:9 relDiff:1.63636
  maxRel-> index:0 golden:10 output:1 absDiff:9 relDiff:1.63636

首先根据类似示例中[VERIFY]:ErrCode: FB4001! tensor_graph Verify for 1 data view list index 0 result FAILED确定精度出错的阶段。如示例中，出错阶段为tensor_graph，即进入pass前精度出错。

定位手段指导#

pass_verify_print与pass_verify_save#

对于在tensor graph阶段的精度问题，进行人工数据分析。精度工具提供pypto.pass_veirfy_print与pypto.pass_verify_save支持用户将自己编写的pypto kernal函数中的tensor的计算结果打印或者保存下来。（注意：该tensor既可以是最终的输出，也可以是中间产生的tensor，但是打印出来的结果并不是在npu中的计算结果，而是基于精度工具模拟执行和用户前端表达的模拟结果）。再开启精度定位前，可先确认精度工具Dump的最终输出与npu计算结果保持一致。详参见pass_verify_print接口示例与 pass_verify_save接口示例。

精度工具skill#

对于在tensor graph阶段的精度问题，借助ai agent进行精度定位。当发现算子精度不对但不知道具体问题在哪，可以调用pypto-precision-compare技能，只需要向助手发送明确的指令“算子test_my_op.py 精度验证失败了，请帮我使用算子精度问题查找技能定位是哪里有问题”，或者直接指定“使用pypto-precision-compare技能，定位test_my_op.py 的精度问题”, 就可以自动插入检查点，根据测试生成数据文件用对比脚本分析结果，得出出错的op。

精度工具自动比对脚本#

对于发生在pass执行阶段的精度问题，使用自动化脚本进行定位。脚本路径：tools/verifier/pass_compare.py 当某个pass精度对比失败的时候，可以利用 pass_compare.py 这个脚本将该对比失败的pass和前面的pass进行精度对比。对比会在精度工具dump数据的目录生成一个类似 verify_pass@SplitK@ExpandFunction@1773821696834386.csv 这样的对比结果文件，里面记录了精度对比失败的pass的每个op节点和前面pass对比的结果，未能匹配上的也会记录在表中标注skip。这样就能定位到匹配上的第一个出错的节点。脚本使用方法：python3 pass_compare.py --p ExpandFunction RemoveUndrivenView --verify_path=..... --p参数后面的是对比的两个pass，空格隔开，前面的是精度对比失败的pass，后面的是作为golden的pass，--verify_path参数是精度工具dump数据文件的那个目录的绝对路径。

错误码：0xB4003U：VERIFY_RESULT_DTYPE_DIFF#

日志示例#

该场景为传入的 in_out_tensors（即 input+output 拼接数组）与 goldens 在同一 index 上 dtype 不一致，日志通常类似如下：

RuntimeError: Errcode: FB4003!
dtype mismatch at index 1
, func ValidateVerifyOutputAndGolden, file runtime.cpp, line XX

触发条件#

SetVerifyData 中 (inputs.size() + outputs.size()) == goldens.size()
同一 index 上 in_out_tensors[i] 和 goldens[i] 都不是 None
两者 dtype 不一致

定位指导#

先根据日志里的 dtype mismatch at index N 锁定出错 index。
在 Python 侧按 inputs + outputs 的顺序找到该 index 对应 tensor，再与 goldens[index] 逐项核对 dtype。
重点检查以下混用场景：torch.float16/torch.float32、bfloat16/float16、int32/int64。
若 golden 来源于 from_torch 或中间转换，确认转换前后的 dtype 没有被隐式修改。
修复原则：同一 index 的 in_out_tensors[i] 与 goldens[i] 必须是同一 dtype；若确需不同精度，请先在 Python 侧显式 to(...) 统一后再传入 verify。

错误码：0xB4002U：VERIFY_RESULT_SHAPE_DIFF#

日志示例#

该场景为传入的 in_out_tensors（即 input+output 拼接数组）与 goldens 在同一 index 上 shape 不一致，日志通常类似如下：

RuntimeError: Errcode: FB4002!
, func ValidateVerifyOutputAndGolden, file runtime.cpp, line XX

触发条件#

SetVerifyData 中 (inputs.size() + outputs.size()) == goldens.size()
同一 index 上 in_out_tensors[i] 和 goldens[i] 都不是 None
rank 不一致，或逐轴比较时出现不匹配

定位指导#

先按 inputs + outputs 的顺序确认对齐关系，再看对应 index 的 shape rank 是否一致。
再逐轴比对：每一轴都必须严格相等。
若报错发生在构造 golden 的流程，优先检查 ori_shape 是否和实际 tensor 语义一致。

错误码：0xB200FU：RUNTIME_EXCEPTION#

日志示例#

该场景为operation模拟执行失败，往往是operation上有不正确的属性，日志示例如下：

[ERROR] PYPTO(1693310):2026-03-20 15:08:54.112 [operation.cpp:58][VERIFY]:ErrCode: FB200F! ExecuteOperation error: op GATHER_IN_UB (magic=10564) input[0] tensorMagic=94, shape=[82816, 512], offset=[0, 0], dynValidShape=[82816, 512], dynOffset=[]
[ERROR] PYPTO(1693310):2026-03-20 15:08:54.112 [operation.cpp:58][VERIFY]:ErrCode: FB200F! ExecuteOperation error: op GATHER_IN_UB (magic=10564) input[1] tensorMagic=3717, shape=[1, 16], offset=[0, 1792], dynValidShape=[RUNTIME_GetViewValidShapeDim(RUNTIME_GetInputShapeDim(ARG_topk_indices,0),((bIdx*((RUNTIME_GetInputShapeDim(ARG_query_nope,0)/RUNTIME_GetInputShapeDim(ARG_kv_act_seqs,0))/128))+s1Idx),1), RUNTIME_GetViewValidShapeDim(2048,((s2_idx*2048)+1792),16)], dynOffset=[((bIdx*((RUNTIME_GetInputShapeDim(ARG_query_nope,0)/RUNTIME_GetInputShapeDim(ARG_kv_act_seqs,0))/128))+s1Idx), ((s2_idx*2048)+1792)]
[ERROR] PYPTO(1693310):2026-03-20 15:08:54.112 [operation.cpp:58][VERIFY]:ErrCode: FB200F! ExecuteOperation error: op GATHER_IN_UB (magic=10564) input[2] tensorMagic=12209, shape=[1, 512], offset=[0, 0], dynValidShape=[RUNTIME_GetViewValidShapeDim(RUNTIME_GetInputShapeDim(ARG_block_table,0),bIdx,1), 512], dynOffset=[bIdx, 0]
[ERROR] PYPTO(1693310):2026-03-20 15:08:54.112 [operation.cpp:58][VERIFY]:ErrCode: FB200F! ExecuteOperation error: op GATHER_IN_UB (magic=10564) output[0] tensorMagic=3716, shape=[16, 512], offset=[0, 0], dynValidShape=[sym_3716_dim_0, sym_3716_dim_1], dynOffset=[]
[ERROR] PYPTO(1693310):2026-03-20 15:08:54.116 [flow_verifier.cpp:299][VERIFY]:ErrCode: FB200F! VerifyPass failed for function TENSOR_LOOP_L4_s2_SA_LoopUnroll1_Unroll1_PATH0_hiddenfunc0_20, pass InferParamIndex (passIndex: 28, captureIndex: 4): 10447510811372117949, 3415564916459561148, 10564, GATHER_IN_UBOpError
func: TENSOR_LOOP_L4_s2_SA_LoopUnroll1_Unroll1_PATH0_hiddenfunc0_leaf22
filename: /data/l00504208/g00955608/pypto/models/deepseek_v32_exp/sparse_flash_attention_quant_impl.py
lineno: 136
/* /data/l00504208/g00955608/pypto/models/deepseek_v32_exp/sparse_flash_attention_quant_impl.py:136 */
<16 x 512 x DT_INT8 / sym_3716_dim_0 x sym_3716_dim_1 x DT_INT8> %3716@3264#(22)MEM_UB::MEM_UB = !10564 TILE_GATHER_IN_UB(g:22, s:-1) %94@106#(1)MEM_DEVICE_DDR::MEM_DEVICE_DDR, %3717@100(0, 1792)(((bIdx*((RUNTIME_GetInputShapeDim(ARG_query_nope,0)/RUNTIME_GetInputShapeDim(ARG_kv_act_seqs,0))/128))+s1Idx), ((s2_idx*2048)+1792))#(22)MEM_DEVICE_DDR::MEM_D
[ERROR] PYPTO(1693310):2026-03-20 15:08:54.116 [flow_verifier.cpp:299][VERIFY]:EVICE_DDR, %12209@102(bIdx, 0)#(22)MEM_DEVICE_DDR::MEM_DEVICE_DDR #IS_CUBE{0} #block_size{128}
<16x512xINT8/0x512xINT8> = GATHER_IN_UB <82816x512xINT8/82816x512xINT8>, <1x16xINT32/1x16xINT32>, <1x512xINT32/1x512xINT32>
out must have shape [topk_count, hidden_dim]

定位指导#

核心报错为： <16x512xINT8/0x512xINT8> = GATHER_IN_UB <82816x512xINT8/82816x512xINT8>, <1x16xINT32/1x16xINT32>, <1x512xINT32/1x512xINT32> out must have shape [topk_count, hidden_dim] 第一行为出错operation的简要信息，示例中，<16x512xINT8/0x512xINT8>为输出的<shape/validshape>,等号右边为这个operation的opcode及其所有输入的<shape/validshape>。示例中，torch cpp抛出错误信息out must have shape [topk_count, hidden_dim]，同时结合上一行信息，可以初步判断该报错来源为该operation的输出的validshape为空shape。如果需要进一步的信息定位，可参考上方几行更详细的报错，包括该operation输入输出tensor的信息，以及该operation的IR。

非典型错误码场景#

错误码： 0xB0001U: VERIFY_NOT_ENABLE#

请检查本地torch >= 2.1.0。

其他错误码#

对于其他类型的错误码，往往是由于pypto内部缺陷导致，如遇到，请在社区联系开发人员解决。