CANN/pypto PASS组件错误码说明
PASS 组件错误码说明文档【免费下载链接】pyptoPyPTO发音: pai p-t-oParallel Tensor/Tile Operation编程范式。项目地址: https://gitcode.com/cann/pypto范围F40000-F44002本文档说明 PASS 组件的错误码定义、场景说明与排查建议。补充错误码时可注明关联 Skill链接至 .agents/skills 下对应技能。错误码定义与使用说明相关错误码的枚举与码值统一定义在framework/include/tilefwk/error_code.hPASS 侧见 TensorErr、OperationErr、FunctionErr、GraphErr、ConfigErr 等。前端传入的错误内容前端用户通用排查方法排查步骤步骤 1日志落盘export ASCEND_PROCESS_LOG_PATH$(pwd)/logs/$(date %Y%m%d%H%M%S)export ASCEND_GLOBAL_LOG_LEVEL0步骤 2识别错误码根据报错信息中的错误码识别问题类别如F40000、F41000。步骤 3对照错误码定义根据错误码前缀定位问题归属F40***→ Tensor 定义或属性问题F41***→ Operation 定义或连接问题F42***→ Function 图结构问题F43***→ Graph 拓扑问题F44***→ 配置问题步骤 4定位用户配置根据错误码定义中的行为描述定位对应的前端配置项。常见前端问题修复建议问题类型修复方法Tile Shape 超限减小 tile shape 参数值Shape 不匹配调整 Tensor shape 或更换 OPdtype 不支持更换为 OP 支持的 dtype空指针确保 Tensor/OP 正确创建和连接边界标记缺失对跨子图 Tensor 设置 boundary 属性循环依赖修改计算逻辑消除数据循环memType 不合法使用框架支持的内存类型路径Tensor相关错误F40000 TENSOR_NULL_POINTER描述Tensor或其关联的操作存在空指针引用行为Tensor的producer为nullTensor的consumer为nullOperation的input tensor为nullOperation的output tensor为nullTensor的消费者中存在null consumerTensor的生产者中存在null producerF40001 TENSOR_INVALID_MEMORY_TYPE描述Tensor的内存类型配置不合法或不匹配行为Tensor 的内存类型为无效 / 未定义值Tensor 的内存类型与所在子图 / 计算单元要求不兼容动态形状 Tensor 使用了不合法的内存类型配置边界 Tensor 未使用规定的内存类型F40002 TENSOR_SUBGRAPH_BOUNDARY描述跨子图使用的Tensor未正确标记边界行为DDR tensor未标记为subgraph boundary跨子图的tensor未标记为subgraph boundaryTensor的subgraph id为NOT_IN_SUBGRAPHF40003 TENSOR_SHAPE_MISMATCH描述Tensor的shape配置与操作语义不匹配行为特定OP的输入输出tensor shape或者memType不合规F40004 TENSOR_UNSUPPORTED_DATATYPE描述Tensor的数据类型不被操作支持行为OP与输入输出tensor支持的数据类型不符F40005 TENSOR_MEMORY_ALLOCATION描述Tensor的内存分配配置不合法行为同一内存区域被多个 Tensor 非法重叠占用内存段划分不合理导致地址越界Tensor 内存大小为0或超出合法分配范围动态内存分配属性缺失或配置非法Tensor 内存对齐方式不符合硬件约束F40006 TENSOR_DYNAMIC_ATTR描述动态形状相关属性缺失或配置错误行为OP的动态相关属性缺失Tensor的dynValidShape为空Operation相关错误F41000 OP_INVALID_OPERAND_COUNT描述OP的输入输出数量不符合预期行为OP的实际输入Tensor数不合规OP的实际输出Tensor数不合规控制依赖 / 边带输入数量不符合约束F41001 OP_NULL_POINTER描述操作或其属性存在空指针引用行为Operation为nullOperation的op attribute为nullOperation的IOperands或OOperands为nullF41002 OP_INVALID_OPCODE描述操作的opcode在当前上下文中不合法行为OP不合规F41003 OP_PRODUCER_CONSUMER描述操作的输入输出依赖关系不完整行为OP没有生产者或者消费者F41004 OP_SPECIAL_CONSTRAINT描述特殊操作违反了特定的约束条件行为特定OP的生产者消费者OP类型不合规特定OP的to memType类型不合规F41005 OP_NESTING_DEPTH描述特定操作的嵌套深度超过限制行为特定OP嵌套深度超过限制F41006 OP_SEQUENCE_ERROR描述操作序列中存在不允许的操作组合行为存在不允许的OP或OP组合Function相关错误F42000 FUNCTION_GRAPH_STRUCTURE描述Function的图结构不完整或不合法行为Function中存在null operationFunction的incast为空Function的outcast为空Function中存在循环依赖子图拓扑结构不正确子图ID超出范围空子图存在F42001 FUNCTION_BOUNDARY_COMPLETENESS描述Function的输入输出边界不完整行为Incast没有consumerOutcast没有producerOperation的subgraphID为负数且不是NOP操作F42002 FUNCTION_GRAPH_CONNECTION描述Function的图连接关系不正确行为输入输出图不匹配子图边界tensor未正确标记边索引超出operations_ size操作的magic number找不到F42003 FUNCTION_EXPAND_FEATURE描述Function展开功能的状态不正确行为ExpandFunctionAccelerate标志未重置为false局部定义的临时tensor用作操作输入没有producerF42004 FUNCTION_MEMORY_REACHABILITY描述Function中的内存类型转换不可达行为特定OP的输入输出memory type不可达输入输出memory type转换路径不存在F42005 FUNCTION_UNIQUENESS描述Function中存在重复的标识符行为Operation的magic number重复Tensor的magic number重复F42006 FUNCTION_SPECIAL_STRUCTURE描述Function中存在特殊的结构性问题行为存在不符合拓扑规范的特殊节点连接方式子图嵌套结构不符合框架约束Function 内存在不允许的特殊算子组合结构Graph相关错误F43000 GRAPH_LOOP_DETECTION描述图中存在循环依赖行为OperationLoopCheck失败存在循环依赖LoopCheck失败存在循环F43001 GRAPH_TOPOLOGY_STRUCTURE描述图的拓扑结构不正确行为子图拓扑结构不正确父子图ID关系不正确parent subGraphId应小于等于subGraphId边索引超出operations_ sizeF43002 GRAPH_SUBGRAPH_EMPTY描述存在空的子图行为子图为空空子图存在F43003 GRAPH_SUBGRAPH_ID_INVALID描述子图ID配置不合法行为子图ID为负数且不是NOP操作子图ID超出totalSubGraphNum范围F43004 GRAPH_EDGE_CONSISTENCY描述图的边连接关系不一致行为inEdgeGraph和outEdgeGraph大小不匹配节点在inGraph_中的位置超出outGraph_范围节点在inGraph_中但在outGraph_中找不到outEdgeGraph中有未被遍历的边F43005 GRAPH_COLOR_CONSISTENCY描述图的着色信息不一致行为colorInGraph_和colorOutGraph_一致性检查失败colorOutGraph_和输入匹配失败原始操作和子图操作之间的边在colorOutGraph_中缺失colorOutGraph_中的边在outGraph_中没有对应边F43006 GRAPH_READY_STATE描述图的就绪状态不一致行为拓扑结构中就绪状态不一致readyState与负的前驱计数不匹配F43007 GRAPH_AIV_AIC_MIX描述子图中混合了不兼容的计算单元行为子图中同时存在AIV和AIC操作子图中同时存在UB和L0/L1内存类型tensorConfig相关错误F44000 CONFIG_MEMORY_TYPE_REACHABLE描述内存类型之间不存在可达的转换路径行为输入输出内存类型不可达内存类型转换路径不存在F44001 CONFIG_SUBGRAPH_BOUNDARY描述跨子图的Tensor边界标记缺失行为DDR tensor未标记为子图边界跨子图的tensor未标记为子图边界F44002 CONFIG_TENSOR_MEMORY_TYPE描述Tensor的内存类型配置不合法行为内存类型不匹配F44003 CONFIG_TENSOR_MEMORY_TYPE描述配置文件读取、解析或加载失败 行为配置文件打开失败配置文件读取失败配置文件中不存在对应的配置项配置文件对应tab下不存在指定的配置key配置项读取失败不存在指定的配置信息【免费下载链接】pyptoPyPTO发音: pai p-t-oParallel Tensor/Tile Operation编程范式。项目地址: https://gitcode.com/cann/pypto创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考