CANN/ops-transformer密集闪电索引Softmax算子

张

张建站

2026/5/10 3:40:53

10分钟阅读

DenseLightningIndexerSoftmaxLse【免费下载链接】ops-transformer本项目是CANN提供的transformer类大模型算子库实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-transformer产品支持情况产品是否支持Ascend 950PR/Ascend 950DT×Atlas A3 训练系列产品√Atlas A2 训练系列产品√Atlas 200I/500 A2 推理产品×Atlas 推理系列产品×Atlas 训练系列产品×功能说明算子功能DenseLightningIndexerSoftmaxLse算子是DenseLightningIndexerGradKlLoss算子计算Softmax输入的一个分支算子。计算公式$$ \text{res}\text{AttentionMask}\left(\text{ReduceSum}\left(W\odot\text{ReLU}\left(Q_{index}K_{index}^T\right)\right)\right) $$$$ \text{maxIndex}\text{max}\left(res\right) $$$$ \text{sumIndex}\text{ReduceSum}\left(\text{exp}\left(res-maxIndex\right)\right) $$maxIndexsumIndex作为输出传递给算子DenseLightningIndexerGradKlLoss作为输入计算Softmax使用。参数说明参数名输入/输出/属性描述数据类型数据格式queryIndex输入lightningIndexer结构的输入queryIndex。FLOAT16、BFLOAT16NDkeyIndex输入lightningIndexer结构的输入keyIndex。FLOAT16、BFLOAT16NDweights输入权重。FLOAT16、BFLOAT16、FLOAT32NDactualSeqLengthsQuery输入每个Batch中Query的有效token数。INT64NDactualSeqLengthsKey输入每个Batch中Key的有效token数。INT64NDlayout输入layout格式。--sparseMode输入sparse的模式。INT64-preTokens输入用于稀疏计算表示Attention需要和前几个token计算关联。INT64-nextTokens输入用于稀疏计算表示Attention需要和后几个token计算关联。INT64-softmaxMaxOut输出softmax计算使用的max值。FLOAT32NDsoftmaxSumOut输出softmax计算使用的sum值。FLOAT32ND约束说明无调用说明调用方式调用样例说明aclnn调用test_aclnn_dense_lightning_indexer_softmax_lse通过aclnnDenseLightningIndexerSoftmaxLse接口方式调用dense_lightning_indexer_softmax_lse算子。【免费下载链接】ops-transformer本项目是CANN提供的transformer类大模型算子库实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-transformer创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

CLIProxyAPI：本地代理打通AI编程工具与官方订阅的协议转换方案

1. 项目概述：CLIProxyAPI，一个为AI编程工具打通本地订阅的“万能转接器”如果你和我一样，日常重度依赖Claude Code、Cursor、Windsurf这类AI编程工具，但每次看到它们只支持API Key，而自己手头明明有官方的Claude Pro、…...

2026/5/10 3:38:48 阅读更多 →

AI赋能潜水教练：Gemini3.1Pro海洋生物识别指南

在 2026 年，AI 的应用场景已经从通用问答、内容生成，逐步扩展到更细分的专业领域。对于潜水教练来说，日常工作不只是带学员下水，还包括海洋生物讲解、潜点介绍、安全提醒、生态保护教育，以及对水下所见生物的快速识别。…...

2026/5/10 3:37:46 阅读更多 →

CANN/driver传感器信息获取API

dcmi_get_device_sensor_info 【免费下载链接】driver 本项目是CANN提供的驱动模块，实现基础驱动和资源管理及调度等功能，使能昇腾芯片。项目地址: https://gitcode.com/cann/driver 函数原型 int dcmi_get_device_sensor_info(int card_id, in…...

2026/5/10 3:35:26 阅读更多 →

BriSe AI：构建类脑自我层次模型，从模式匹配迈向自主理解

1. 项目概述：从“模仿”到“涌现”的范式跃迁最近和几位做认知科学和神经科学的朋友聊得比较多，大家都有一个共同的感受：当前主流的人工智能，无论是大语言模型还是多模态模型，本质上还是在做“模式匹配”和“概率预测…...

2026/5/10 0:03:41 阅读更多 →

6G边缘计算与生成式AI融合：基于LDM与DRL的协同优化架构实践

1. 项目概述：当6G边缘计算遇上生成式AI最近和几个做通信和AI的朋友聊天，大家不约而同地提到了一个词：6G边缘生成式AI。这听起来像是把几个最前沿的技术名词硬凑在一起，但当你真正拆开来看，会发现它背后指向的是一个非常…...

2026/5/10 0:03:49 阅读更多 →

DriverStore Explorer完全指南：轻松管理Windows驱动，释放宝贵磁盘空间

DriverStore Explorer完全指南：轻松管理Windows驱动，释放宝贵磁盘空间【免费下载链接】DriverStoreExplorer Driver Store Explorer 项目地址: https://gitcode.com/gh_mirrors/dr/DriverStoreExplorer 你是否曾因为Windows系统变得越来越臃肿而…...

2026/5/10 0:10:01 阅读更多 →