CANN/cann-recipes-infer hc_post后处理算子

张

张建站

2026/5/9 12:02:31

10分钟阅读

custom-npu_hc_post【免费下载链接】cann-recipes-infer本项目针对LLM与多模态模型推理业务中的典型模型、加速算法提供基于CANN平台的优化样例项目地址: https://gitcode.com/cann/cann-recipes-infer产品支持情况产品是否支持Atlas A3 推理系列产品√Ascend 950PR/Ascend 950DT√功能说明hc_post 是 mHC 结构的后处理部分计算逻辑计算过程如下$$ out post.unsqueeze(-1) * x.unsqueeze(-2) torch.sum(comb.unsqueeze(-1) * residual.unsqueeze(-2), dim2) $$函数原型custom.npu_hc_post(Tensor x, Tensor residual, Tensor post, Tensor comb) - Tensor参数说明说明bbatch size表示输入样本批量大小、ssequence length表示输入样本序列长度、hchead count表示注意力头数、dhead dimension表示注意力头的维度数。xTensor必选参数输入tensor。不支持非连续数据格式支持ND数据类型支持bfloat16float16float32shape为[b, s, d]或[b * s, d]。residualTensor必选参数输入tensor。不支持非连续数据格式支持ND数据类型支持bfloat16float16float32shape为[b, s, hc, d]或[b * s, hc, d]。postTensor必选参数输入tensor。不支持非连续数据格式支持ND数据类型支持bfloat16float16float32shape为[b, s, hc]或[b * s, hc]。combTensor必选参数输入tensor。不支持非连续数据格式支持ND数据类型支持bfloat16float16float32shape为[b, s, hc, hc]或[b * s, hc, hc]。返回值说明yTensor输出tensor。不支持非连续数据格式支持ND数据类型支持bfloat16float16float32shape与residual的shape一致为[b, s, hc, d]或[b * s, hc, d]。约束说明shape 字段取值范围约束 | 字段名 | 取值规则与说明 | |--------------|-------------------------------------------| | hc | 取值固定为: 4 | | d | 取值固定为4096 |x、residual和y的dtype要保持一致。post和comb的dtype要保持一致。该接口支持推理场景下使用。该接口支持aclgraph入图。该接口与PyTorch配合使用时需要保证CANN相关包与PyTorch相关包的版本匹配。调用示例详见 test_npu_hc_post.py【免费下载链接】cann-recipes-infer本项目针对LLM与多模态模型推理业务中的典型模型、加速算法提供基于CANN平台的优化样例项目地址: https://gitcode.com/cann/cann-recipes-infer创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

CANN/hccl PyTorch AllReduce示例

使用 PyTorch 执行 AllReduce 操作【免费下载链接】hccl 集合通信库（Huawei Collective Communication Library，简称HCCL）是基于昇腾AI处理器的高性能集合通信库，为计算集群提供高性能、高可靠的通信方案项目地址: https://gi…...

2026/5/9 12:00:31 阅读更多 →

装载机动臂焊后变形矫正距离神经网络预测方法【附代码】

✨ 本团队擅长数据搜集与处理、建模仿真、程序设计、仿真代码、EI、SCI写作与指导，毕业论文、期刊论文经验交流。 ✅ 专业定制毕设、代码 ✅ 如需沟通交流，可以私信，或者点击《获取方式》 （1）融合弹塑性微分方程的物理…...

2026/5/9 11:58:36 阅读更多 →

CANN/hixl FabricMem模式设计

Fabric Mem传输模式需求【免费下载链接】hixl HIXL（Huawei Xfer Library）是一个灵活、高效的昇腾单边通信库，面向集群场景提供简单、可靠、高效的点对点数据传输能力。项目地址: https://gitcode.com/cann/hixl 介绍需求的背景&am…...

2026/5/9 11:58:32 阅读更多 →

Autovisor：终极自动化学习助手 - 5分钟快速上手智慧树刷课教程

Autovisor：终极自动化学习助手 - 5分钟快速上手智慧树刷课教程【免费下载链接】Autovisor 2025智慧树刷课脚本基于Python Playwright的自动化程序 [有免安装版] 项目地址: https://gitcode.com/gh_mirrors/au/Autovisor 你是否厌倦了每天手动点击播放、等待…...

2026/5/9 12:51:47 阅读更多 →

ModelScope Auto Proxy：智能路由网关，零成本统一调用免费大模型API

1. 项目概述与核心价值如果你和我一样，是个重度依赖 AI 编程工具（比如 Cursor、Cline）的开发者，那你肯定对 OpenAI 的 API 调用成本又爱又恨。爱的是它强大的能力，恨的是账单上的数字。最近，国内的开源社…...

2026/5/9 5:30:52 阅读更多 →

从零到一：手把手教你用BetaFlight CLI命令配置AOCODARC H7DUAL飞控板（保姆级教程）

从零到一：手把手教你用BetaFlight CLI命令配置AOCODARC H7DUAL飞控板（保姆级教程） 当你第一次拿到AOCODARC H7DUAL这块飞控板时，可能会被密密麻麻的引脚和复杂的配置选项吓到。别担心，这篇教程将带你从零开始&#xff…...

2026/5/9 12:51:47 阅读更多 →

League Akari：你的英雄联盟游戏体验进化指南

League Akari：你的英雄联盟游戏体验进化指南【免费下载链接】League-Toolkit An all-in-one toolkit for LeagueClient. Gathering power 🚀. 项目地址: https://gitcode.com/gh_mirrors/le/League-Toolkit 想象一下这样的场景：你正在…...

2026/5/9 12:51:46 阅读更多 →