CANN/pypto分布式共享内存信号API

张

张建站

2026/5/9 11:36:59

10分钟阅读

pypto.distributed.shmem_signal【免费下载链接】pyptoPyPTO发音: pai p-t-oParallel Tensor/Tile Operation编程范式。项目地址: https://gitcode.com/cann/pypto产品支持情况产品是否支持Atlas A3 推理系列产品√Atlas A2 推理系列产品√功能说明根据 offsets 指定的索引位置将信号值 signal 写入 target_pe 对应的 shared memory tensor 的部分视图从而通知 target_pe。函数原型shmem_signal( src: ShmemTensor, src_pe: Union[int, SymbolicScalar], signal: int, shape: list[int] None, offsets: list[Union[int, SymbolicScalar]] None, *, target_pe: Union[int, SymbolicScalar], sig_op: AtomicType AtomicType.SET, pred: list[Tensor] None, ) - Tensor参数说明参数名输入/输出说明src输入触发信号的 shared memory tensor。src_pe输入shared memory tensor 所属的 pe0 pe n_pes。支持的数据类型为 int 或 SymbolicScalar 类型。signal输入发送到 src 中的信号值。支持的数据类型为int类型。shape输入需要写入信号的 shared memory tensor 的视图大小。参数类型为 list[int] 类型。offsets输入需要写入信号的 shared memory tensor 的视图的偏移量。支持 int 或 SymbolicScalar 类型的列表。offsets 的维度应与 src 的维度一致且每个维度的偏移量值应小于 src 对应维度的大小。target_pe输入接收信号的 pe。如果 target_pe -1则广播信号给所有 pe。支持 int 或 SymbolicScalar 类型的列表。sig_op输入数据传输时应用的原子操作类型。支持的数据类型为: AtomicType.SETAtomicType.ADD。默认为 AtomicType.SET 类型。pred输入用于控制操作执行的依赖关系张量列表。对数据类型无要求。不支持空 Tensor。返回值说明返回一个输出 Tensor用于表示操作完成的依赖关系。约束说明shmem_signal 和 shmem_wait_until 必须配合使用且设置 TileShape 时切块大小保持一致。调用示例TileShape 设置示例说明调用 shmem_signal 前应通过 set_vec_tile_shapes 设置 TileShape TileShape 维度应和参数 shape 保持一致。示例1参数 shape 为 [m, n]TileShape设置为 [m1, n1]则 m1n1 分别用于切分 mn 轴。pypto.set_vec_tile_shapes(4, 8)接口调用示例示例 1将信号值 2 写入 pe 1 的 shared memory tensor 的全部视图中并与该视图原本的值进行累加操作从而通知 pe 1。shmem_tensor pypto.distributed.create_shmem_tensor(group_nametp, n_pes8, dtypepypto.DT_FP16, shape[64, 128]) pypto.set_vec_tile_shapes(32, 64) signal_out pypto.distributed.shmem_signal( srcshmem_tensor, src_pe1, signal2, target_pe1, sig_oppypto.AtomicType.ADD, predpredToken, )示例 2将信号值 2 写入 pe 1 的 shared memory tensor 的部分视图中从而通知 pe 1。该部分视图的 shape 为 [64, 64]offset 为 [0, 0] 并与该视图原本的值进行累加操作。shmem_tensor pypto.distributed.create_shmem_tensor(group_nametp, n_pes8, dtypepypto.DT_FP16, shape[64, 128]) pypto.set_vec_tile_shapes(32, 64) signal_out pypto.distributed.shmem_signal( srcshmem_tensor, src_pe1, signal2, shape[64, 64], offsets[0, 0], target_pe1, sig_oppypto.AtomicType.ADD, predpredToken, )示例 3将信号值 4 写入 pe 3 的 shared memory tensor 的部分视图中从而通知 pe 5。该部分视图的 shape 为 [64, 64]offset 为 [0, 1] 并覆盖该视图原本的值。shmem_tensor pypto.distributed.create_shmem_tensor(group_nametp, n_pes8, dtypepypto.DT_FP16, shape[64, 128]) pypto.set_vec_tile_shapes(32, 64) signal_out pypto.distributed.shmem_signal( srcshmem_tensor, src_pe3, signal4, shape[64, 64], offsets[0, 1], target_pe5, sig_oppypto.AtomicType.SET, predpredToken, )示例 4将信号值 4 写入 pe 3 的 shared memory tensor 的部分视图中从而通知所有 pe。该部分视图的 shape 为 [64, 64]offset 为 [0, 1] 并覆盖该视图原本的值。shmem_tensor pypto.distributed.create_shmem_tensor(group_nametp, n_pes8, dtypepypto.DT_FP16, shape[64, 128]) pypto.set_vec_tile_shapes(32, 64) signal_out pypto.distributed.shmem_signal( srcshmem_tensor, sec_pe3, signal4, shape[64, 64], offsets[0, 1], target_pe-1, predpredToken, )【免费下载链接】pyptoPyPTO发音: pai p-t-oParallel Tensor/Tile Operation编程范式。项目地址: https://gitcode.com/cann/pypto创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

体验低延迟与高稳定的大模型API调用服务

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。 👉 点击领取海量免费额度体验低延迟与高稳定的大模型API调用服务在需要与大模型进行高频、连续交互的开发或学习场景中，服务的响应速度和稳定性…...

2026/5/9 11:35:46 阅读更多 →

CANN/ge安全声明

安全声明【免费下载链接】ge GE（Graph Engine）是面向昇腾的图编译器和执行器，提供了计算图优化、多流并行、内存复用和模型下沉等技术手段，加速模型执行效率，减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的…...

2026/5/9 11:30:42 阅读更多 →

2026最新AI商拍工具横向测评：不同电商类目怎么选？服装行业首推知衣FD+

在2026年的电商极度竞争环境下，针对垂直品类选择具备行业结构化能力的AI商拍工具，能大幅降低商拍及制作成本，整体视觉产出成本下降80%-90%以上，这是实现降本增效的根本途径。针对当前跨境及国内电商市场环境，为精准解决…...

2026/5/9 11:28:33 阅读更多 →

Autovisor：终极自动化学习助手 - 5分钟快速上手智慧树刷课教程

Autovisor：终极自动化学习助手 - 5分钟快速上手智慧树刷课教程【免费下载链接】Autovisor 2025智慧树刷课脚本基于Python Playwright的自动化程序 [有免安装版] 项目地址: https://gitcode.com/gh_mirrors/au/Autovisor 你是否厌倦了每天手动点击播放、等待…...

2026/5/7 18:12:05 阅读更多 →

ModelScope Auto Proxy：智能路由网关，零成本统一调用免费大模型API

1. 项目概述与核心价值如果你和我一样，是个重度依赖 AI 编程工具（比如 Cursor、Cline）的开发者，那你肯定对 OpenAI 的 API 调用成本又爱又恨。爱的是它强大的能力，恨的是账单上的数字。最近，国内的开源社…...

2026/5/9 5:30:52 阅读更多 →

从零到一：手把手教你用BetaFlight CLI命令配置AOCODARC H7DUAL飞控板（保姆级教程）

从零到一：手把手教你用BetaFlight CLI命令配置AOCODARC H7DUAL飞控板（保姆级教程） 当你第一次拿到AOCODARC H7DUAL这块飞控板时，可能会被密密麻麻的引脚和复杂的配置选项吓到。别担心，这篇教程将带你从零开始&#xff…...

2026/5/7 19:32:04 阅读更多 →

League Akari：你的英雄联盟游戏体验进化指南

League Akari：你的英雄联盟游戏体验进化指南【免费下载链接】League-Toolkit An all-in-one toolkit for LeagueClient. Gathering power 🚀. 项目地址: https://gitcode.com/gh_mirrors/le/League-Toolkit 想象一下这样的场景：你正在…...

2026/5/7 19:28:13 阅读更多 →