Deepseek MLA CP通信AlltoAll

张

张建站

2026/5/26 9:27:01

10分钟阅读

长文本CP 切分共2次All2All第一次AlltoAll输入按Seq维度汇总按Head维度切。切输入非TP维度的切参数[s/c, b, n/t, h] -AlltoAll- [s, b, n/(t*c), h]第二次AlltoAll恢复按Seq维度切按Head维度汇总。[s, b, n/(t*c), h] -AlltoAll- [s/c, b, n/t, h]其中t 为TP, c 为CP, n nHead数举例 CP 2, TP 4 , H 8192, nHead 16阶段形状说明输入[s/2, b, 8192]CP 切分后每 rank 持有半个序列MLA 解压后 Q/K/V[s/2, b, 16, 192]16 heads/rank64 heads ÷ TP4经过了TP的降维A2A 后scatter headgather seq[s, b, 8, 192]全序列head 减半Flash Attention 输出[s, b, 8, 128]全序列本地计算A2A 后scatter seqgather head[s/2, b, 16, 128]还原序列分片o_proj 后[s/2, b, 8192]还原 hidden_states, 经过TP升维compressed_kv [s, b, 576] ← kv_a_proj 压缩后的 latent是 _preprocess 的输入 │ ├── split → ct_kv [s, b, 512] ← kv_lora_rank 部分 │ k_pe [s, b, 64] ← rope 部分 │ ├── kv_a_layernorm(ct_kv) │ └── kv_b_proj (Up-projection, 解压) [s, b, 512] → [s, b, 16heads, 128128] k_nope [s, b, 16, 128] v [s, b, 16, 128] q_b_input (经过 q_b_proj 解压) q_nope [s, b, 16, 128] q_pe [s, b, 16, 64] 最终拼接: query_states [s, b, 16, 192] q_nope q_pe key_states [s, b, 16, 192] k_nope k_pe value_states [s, b, 16, 128]MLA attention:DeepseekV2Attention └── self.core_attention_flash FlashAttention(...) # 基础 flash attn ↓ (当 CP alltoall 时自动包装) └── self.core_attention_flash DistributedAttention(FlashAttention, cp_group)

Agent身份与权限系统命令行交互入口：分层架构 + 多 Agent 协作模式

一、程序概述与架构设计Agent 身份与权限系统的命令行交互入口，采用分层架构多Agent协作模式，核心价值在于：屏蔽底层 API 调用的复杂性，让用户通过自然语言直接驱动完整的智能体工作流。程序整体分为四层：CLI 交互…...

2026/5/26 9:25:38 阅读更多 →

GitLab CI 驱动禅道自动化部署：从零构建企业级 CI/CD 流水线

GitLab CI 驱动禅道自动化部署：从零构建企业级 CI/CD 流水线 1. 引言禅道（ZenTao）作为国内领先的开源项目管理软件，已在无数研发团队中扮演着“枢纽”角色——产品经理提需求，开发团队领任务，测试人员报 B…...

2026/5/26 9:23:58 阅读更多 →

实验报告（一）

文章目录一、基础知识介绍二、TuGraph 平台启动步骤三、交易数据集图建模与数据导入1. 图建模2. 数据导入四、Cypher 查询语句示例1.基础查询2.特殊查询一、基础知识介绍图数据库基础图数据库基于属性图模型，以顶点（节点）、边（…...

2026/5/26 9:23:03 阅读更多 →

PS5 NOR修改器终极指南：简单三步修复你的游戏主机

PS5 NOR修改器终极指南：简单三步修复你的游戏主机【免费下载链接】PS5NorModifier The PS5 Nor Modifier is an easy to use Windows based application to rewrite your PS5 NOR file. This can be useful if your NOR is corrupt, or if you have a disc edition…...

2026/5/25 2:11:12 阅读更多 →

毕业论文，如何合规使用AI

2022年11月出现了大语言模型ChatGPT，今年是第一批使用大模型大学生毕业的第一年，如何安全、高效地使用AIGC正在成为不少人关心的重要事情。大学生或研究生毕业论文使用AIGC的核心原则是：把它当成你的“科研实习生”，而不是“代笔枪…...

2026/5/24 0:21:38 阅读更多 →

3步彻底解决RDP Wrapper [not supported]问题：实战修复指南

3步彻底解决RDP Wrapper [not supported]问题：实战修复指南【免费下载链接】rdpwrap RDP Wrapper Library 项目地址: https://gitcode.com/gh_mirrors/rd/rdpwrap RDP Wrapper是一款让Windows家庭版支持多用户远程桌面的开源工具，但许多用户在系…...

2026/5/24 0:32:45 阅读更多 →