CANN/ascend-transformer-boost PagedAttentionOperation C++ Demo

张

张建站

2026/5/9 13:01:58

10分钟阅读

CANN/ascend-transformer-boost PagedAttentionOperation C++ Demo

加速库PagedAttentionOperation C Demo【免费下载链接】ascend-transformer-boost本项目是CANN提供的是一款高效、可靠的Transformer加速库基于华为Ascend AI处理器提供Transformer定制化场景的高性能融合算子。项目地址: https://gitcode.com/cann/ascend-transformer-boost介绍该目录下为加速库PagedAttentionOperation C调用示例。使用说明首先source 对应的CANN和nnal包的安装路径source [cann安装路径]/set_env.sh 默认source /usr/local/Ascend/ascend-toolkit/set_env.shsource [nnal安装路径]/set_env.sh默认source /usr/local/Ascend/nnal/atb/set_env.sh①. 如果使用加速库源码编译source [加速库源码路径]/output/atb/set_env.sh例如 source ./ascend-transformer-boost/output/atb/set_env.sh运行demobash build.sh注意使用cxx_abi0默认时设置D_GLIBCXX_USE_CXX11_ABI为0即g -D_GLIBCXX_USE_CXX11_ABI0 -I ...使用cxx_abi1时更改D_GLIBCXX_USE_CXX11_ABI为1即g -D_GLIBCXX_USE_CXX11_ABI1 -I ...提供的build脚本仅用于编译和运行paged_attention_demo.cpp如需编译其他demo需要替换“paged_attention_demo”为对应的cpp文件名额外说明示例中生成的数据不代表实际场景如需数据生成参考请查看根目录下的python用例目录 tests/apitest/opstest/python/operations/paged_attention/产品支持情况本op在Atlas A2/A3系列和Atlas 推理系列产品上实现有所区别场景说明提供demo编译运行时需要对应更改build脚本不开启并行解码且带mask场景paged_attention_demo.cpp默认编译脚本可编译运行该demo仅支持在Atlas A2/A3系列上运行。参数设置成员名称取值headNum32qkScale1 / sqrt(HEAD_SIZE)kvHeadNum32batchRunStatus0quantTypeTYPE_QUANT_UNQUANThasQuantOffsetfalsecalcTypeCALC_TYPE_UNDEFINEDcompressTypeCOMPRESS_TYPE_UNDEFINEDmaskTypeMASK_TYPE_NORMmlaVHeadSize0数据规格tensor名字数据类型数据格式维度信息cpu/npuqueryfloat16nd[2, 32, 128]npukeyCachefloat16nd[16, 128, 32, 128]npuvalueCachefloat16nd[16, 128, 32, 128]npublockTablesint32nd[2, 8]npucontextLensint32nd[2]cpumaskint32nd[2, 1, 1024]npuattnOutfloat16nd[2, 32, 128]npupaged_attention_qwen_demo.cpp该demo仅支持在Atlas A2/A3系列上运行。参数设置成员名称取值headNum5qkScale1 / sqrt(HEAD_SIZE)kvHeadNum1batchRunStatus0quantTypeTYPE_QUANT_UNDEFINEDhasQuantOffsetfalsecalcTypeCALC_TYPE_UNDEFINEDcompressTypeCOMPRESS_TYPE_UNDEFINEDmaskTypeUNDEFINEDmlaVHeadSize0数据规格tensor名字数据类型数据格式维度信息cpu/npuquerybf16nd[1, 5, 128]npuqkScalebf16nd[9, 128, 1, 128]npuvalueCachebf16nd[9, 128, 1, 128]npublockTablesint32nd[1, 8]npucontextLensint32nd[1]cpuattnOutbf16nd[1, 5, 128]npu不带maskpaged_attention_inference_demo.cpp该demo仅支持在Atlas推理系列产品上运行。参数设置成员名称取值headNum32qkScale1 / sqrt(HEAD_SIZE)kvHeadNum32batchRunStatus0quantTypeTYPE_QUANT_UNQUANThasQuantOffsetfalsecalcTypeCALC_TYPE_UNDEFINEDcompressTypeCOMPRESS_TYPE_UNDEFINEDmaskTypeUNDEFINEDmlaVHeadSize0数据规格tensor名字数据类型数据格式维度信息cpu/npuquerybf16nd[2, 32, 128]npuqkScalebf16nd[16, 1024, 128, 16]npuvalueCachebf16nd[16, 1024, 128, 16]npublockTablesint32nd[2, 8]npucontextLensint32nd[2]cpuattnOutbf16nd[2, 32, 128]npu【免费下载链接】ascend-transformer-boost本项目是CANN提供的是一款高效、可靠的Transformer加速库基于华为Ascend AI处理器提供Transformer定制化场景的高性能融合算子。项目地址: https://gitcode.com/cann/ascend-transformer-boost创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

CANN竞赛Erf算子赛题

一、赛题背景【免费下载链接】cann-competitions 本仓库用于 CANN 开源社区各类竞赛、开源课题、社区任务等课题发布、开发者作品提交和展示。项目地址: https://gitcode.com/cann/cann-competitions 高斯误差函数 (erf) 是数学和统计学中的基本函数，广泛应…...

2026/5/9 13:00:00 阅读更多 →

CANN/pyasc digamma函数文档

asc.language.adv.digamma 【免费下载链接】pyasc 本项目为Python用户提供算子编程接口，支持在昇腾AI处理器上加速计算，接口与Ascend C一一对应并遵守Python原生语法。项目地址: https://gitcode.com/cann/pyasc asc.language.adv.digamma(dst: …...

2026/5/9 12:56:48 阅读更多 →

CANN/ops-fft构建参数说明

build.sh 参数说明【免费下载链接】ops-fft ops-fft 是 CANN （Compute Architecture for Neural Networks）算子库中提供 FFT 类计算的基础算子库，采用模块化设计，支持灵活的算子开发和管理。项目地址: https://gitcode.com/ca…...

2026/5/9 12:56:15 阅读更多 →

Autovisor：终极自动化学习助手 - 5分钟快速上手智慧树刷课教程

Autovisor：终极自动化学习助手 - 5分钟快速上手智慧树刷课教程【免费下载链接】Autovisor 2025智慧树刷课脚本基于Python Playwright的自动化程序 [有免安装版] 项目地址: https://gitcode.com/gh_mirrors/au/Autovisor 你是否厌倦了每天手动点击播放、等待…...

2026/5/9 12:51:47 阅读更多 →

ModelScope Auto Proxy：智能路由网关，零成本统一调用免费大模型API

1. 项目概述与核心价值如果你和我一样，是个重度依赖 AI 编程工具（比如 Cursor、Cline）的开发者，那你肯定对 OpenAI 的 API 调用成本又爱又恨。爱的是它强大的能力，恨的是账单上的数字。最近，国内的开源社…...

2026/5/9 5:30:52 阅读更多 →

从零到一：手把手教你用BetaFlight CLI命令配置AOCODARC H7DUAL飞控板（保姆级教程）

从零到一：手把手教你用BetaFlight CLI命令配置AOCODARC H7DUAL飞控板（保姆级教程） 当你第一次拿到AOCODARC H7DUAL这块飞控板时，可能会被密密麻麻的引脚和复杂的配置选项吓到。别担心，这篇教程将带你从零开始&#xff…...

2026/5/9 12:51:47 阅读更多 →

League Akari：你的英雄联盟游戏体验进化指南

League Akari：你的英雄联盟游戏体验进化指南【免费下载链接】League-Toolkit An all-in-one toolkit for LeagueClient. Gathering power 🚀. 项目地址: https://gitcode.com/gh_mirrors/le/League-Toolkit 想象一下这样的场景：你正在…...

2026/5/9 12:51:46 阅读更多 →