CANN/asc-devkit自然对数API文档

张

张建站

2026/5/11 7:47:04

10分钟阅读

Ln【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言原生支持C和C标准规范主要由类库和语言扩展层构成提供多层级API满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit产品支持情况产品是否支持Ascend 950PR/Ascend 950DT√Atlas A3 训练系列产品 / Atlas A3 推理系列产品√Atlas A2 训练系列产品 / Atlas A2 推理系列产品√Kirin X90√Kirin 9030√功能说明按元素取自然对数计算公式如下函数原型tensor前n个数据计算template typename T, const LnConfig config DEFAULT_LN_CONFIG __aicore__ inline void Ln(const LocalTensorT dst, const LocalTensorT src, const int32_t count)tensor高维切分计算mask逐bit模式template typename T, bool isSetMask true, const LnConfig config DEFAULT_LN_CONFIG __aicore__ inline void Ln(const LocalTensorT dst, const LocalTensorT src, uint64_t mask[], const uint8_t repeatTime, const UnaryRepeatParams repeatParams)mask连续模式template typename T, bool isSetMask true, const LnConfig config DEFAULT_LN_CONFIG __aicore__ inline void Ln(const LocalTensorT dst, const LocalTensorT src, uint64_t mask, const uint8_t repeatTime, const UnaryRepeatParams repeatParams)参数说明表 1模板参数说明参数名描述T操作数数据类型。Ascend 950PR/Ascend 950DT支持的数据类型为half、float。Atlas A3 训练系列产品 / Atlas A3 推理系列产品支持的数据类型为half、float。Atlas A2 训练系列产品 / Atlas A2 推理系列产品支持的数据类型为half、float。Kirin X90支持的数据类型为half、float。Kirin 9030支持的数据类型为half、float。isSetMask是否在接口内部设置mask。true表示在接口内部设置mask。false表示在接口外部设置mask开发者需要使用SetVectorMask接口设置mask值。这种模式下本接口入参中的mask值必须设置为占位符MASK_PLACEHOLDER。config用于配置Subnormal计算模式LnConfig类型定义如下enum class LnAlgo { INTRINSIC 0, PRECISION_1ULP_FTZ_TRUE, PRECISION_1ULP_FTZ_FALSE, }; struct LnConfig { LnAlgo algo LnAlgo::INTRINSIC; }通过LnConfig结构体的参数algo来配置Subnormal计算模式。algo取值如下LnAlgo::INTRINSIC、LnAlgo::PRECISION_1ULP_FTZ_TRUE使用单指令计算得出结果所有Subnormal被近似为0。LnAlgo::PRECISION_1ULP_FTZ_FALSE支持Subnormal数据计算。该参数默认值DEFAULT_LN_CONFIG的取值如下constexpr LnConfig DEFAULT_LN_CONFIG { LnAlgo::INTRINSIC };表 2参数说明参数名输入/输出描述dst输出目的操作数。类型为LocalTensor支持的TPosition为VECIN/VECCALC/VECOUT。LocalTensor的起始地址需要32字节对齐。src输入源操作数。类型为LocalTensor支持的TPosition为VECIN/VECCALC/VECOUT。LocalTensor的起始地址需要32字节对齐。源操作数的数据类型需要与目的操作数保持一致。count输入参与计算的元素个数。mask[]/mask输入mask用于控制每次迭代内参与计算的元素。逐bit模式可以按位控制哪些元素参与计算bit位的值为1表示参与计算0表示不参与。mask为数组形式数组长度和数组元素的取值范围和操作数的数据类型有关。当操作数为16位时数组长度为2mask[0]、mask[1]∈[0, 264-1]并且不同时为0当操作数为32位时数组长度为1mask[0]∈(0, 264-1]当操作数为64位时数组长度为1mask[0]∈(0, 232-1]。例如mask[8, 0]80b1000表示仅第4个元素参与计算。连续模式表示前面连续的多少个元素参与计算。取值范围和操作数的数据类型有关数据类型不同每次迭代内能够处理的元素个数最大值不同。当操作数为16位时mask∈[1, 128]当操作数为32位时mask∈[1, 64]当操作数为64位时mask∈[1, 32]。repeatTime输入重复迭代次数。矢量计算单元每次读取连续的256Bytes数据进行计算为完成对输入数据的处理必须通过多次迭代repeat才能完成所有数据的读取与计算。repeatTime表示迭代的次数。repeatParams输入控制操作数地址步长的参数。UnaryRepeatParams类型包含操作数相邻迭代间相同DataBlock的地址步长操作数同一迭代内不同DataBlock的地址步长等参数。返回值说明无约束说明操作数地址对齐要求请参见通用地址对齐约束。操作数地址重叠约束请参考通用地址重叠约束。调用示例本样例的srcLocal和dstLocal均为half类型。更多样例可参考LINK。tensor高维切分计算样例-mask连续模式uint64_t mask 256 / sizeof(half); // repeatTime 4, 128 elements one repeat, 512 elements total // dstBlkStride, srcBlkStride 1, no gap between blocks in one repeat // dstRepStride, srcRepStride 8, no gap between repeats AscendC::Ln(dstLocal, srcLocal, mask, 4, { 1, 1, 8, 8 });tensor高维切分计算样例-mask逐bit模式uint64_t mask[2] { UINT64_MAX, UINT64_MAX }; // repeatTime 4, 128 elements one repeat, 512 elements total // dstBlkStride, srcBlkStride 1, no gap between blocks in one repeat // dstRepStride, srcRepStride 8, no gap between repeats AscendC::Ln(dstLocal, srcLocal, mask, 4, { 1, 1, 8, 8 });tensor前n个数据计算样例AscendC::Ln(dstLocal, srcLocal, 512); static constexpr LnConfig config { LnAlgo::PRECISION_1ULP_FTZ_FALSE }; AscendC::LnT, config(dstLocal, srcLocal, 512);结果示例如下输入数据srcLocal[1 2 3 4 ...] 输出数据dstLocal[0 0.6931 1.0986 1.3863 ...]【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言原生支持C和C标准规范主要由类库和语言扩展层构成提供多层级API满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

怎样轻松掌握NVIDIA Profile Inspector：5个实用技巧解锁显卡隐藏性能

怎样轻松掌握NVIDIA Profile Inspector：5个实用技巧解锁显卡隐藏性能【免费下载链接】nvidiaProfileInspector 项目地址: https://gitcode.com/gh_mirrors/nv/nvidiaProfileInspector 还在为游戏卡顿、画面撕裂而烦恼吗？NVIDIA Profile Inspect…...

2026/5/11 7:46:08 阅读更多 →

CANN asc_copy矢量复制API文档

asc_copy 【免费下载链接】asc-devkit 本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言，原生支持C和C标准规范，主要由类库和语言扩展层构成，提供多层级API，满足多维场景算子开发诉求。项目地址: https://gitcode.com/c…...

2026/5/11 7:46:07 阅读更多 →

Yeti社区插件生态解析：如何利用现有资源快速扩展平台功能

Yeti社区插件生态解析：如何利用现有资源快速扩展平台功能【免费下载链接】yeti Your Everyday Threat Intelligence 项目地址: https://gitcode.com/gh_mirrors/ye/yeti Yeti作为一款强大的威胁情报平台（Your Everyday Threat Intelligence&…...

2026/5/11 7:43:32 阅读更多 →

BriSe AI：构建类脑自我层次模型，从模式匹配迈向自主理解

1. 项目概述：从“模仿”到“涌现”的范式跃迁最近和几位做认知科学和神经科学的朋友聊得比较多，大家都有一个共同的感受：当前主流的人工智能，无论是大语言模型还是多模态模型，本质上还是在做“模式匹配”和“概率预测…...

2026/5/10 0:03:41 阅读更多 →

6G边缘计算与生成式AI融合：基于LDM与DRL的协同优化架构实践

1. 项目概述：当6G边缘计算遇上生成式AI最近和几个做通信和AI的朋友聊天，大家不约而同地提到了一个词：6G边缘生成式AI。这听起来像是把几个最前沿的技术名词硬凑在一起，但当你真正拆开来看，会发现它背后指向的是一个非常…...

2026/5/10 0:03:49 阅读更多 →

DriverStore Explorer完全指南：轻松管理Windows驱动，释放宝贵磁盘空间

DriverStore Explorer完全指南：轻松管理Windows驱动，释放宝贵磁盘空间【免费下载链接】DriverStoreExplorer Driver Store Explorer 项目地址: https://gitcode.com/gh_mirrors/dr/DriverStoreExplorer 你是否曾因为Windows系统变得越来越臃肿而…...

2026/5/10 0:10:01 阅读更多 →