文 | 智能相对论作者 | 陈泊丞从去年开始中国大模型能力已经追到了全球第一梯队。MiniMax M2.5、Kimi K2.5的Token消耗量在OpenRouter上长期位居前列DeepSeek V4也常被拿来与GPT-5对标。但很多人忽略了这些模型之所以“能跑”是因为现有算力底座“够用”。那什么时候“够用”会不够用呢答案是Agent时代。而且在这个阶段“能跑”和“跑得舒服”又是两码事。在今年的鲲鹏昇腾开发者大会2026——昇腾AI开发者峰会2026上昇腾给出了一个更底层的量化洞察过去一年模型调用频次暴涨50到100倍序列长度从Chatbot时代的4K飙升至接近1M相当于250倍的跨度。MoE推理对时延的要求也越来越苛刻正从10毫秒向1毫秒级别逼近。这不是“模型变大了”的量变问题而是整个算力底座的底层逻辑需要被重写的质变信号。所以真正的问题不是“现有算力够不够”而是当Agent的胃口以指数增长不仅消耗得更多而且创造的需求在井喷那么现有算力架构的“够用”还能撑多久基于这个视角我们会发现昇腾今年在峰会上讲的三件事即超节点架构创新、软件全面开源开放、开发者体验升级背后的本质上都是在回答同一个问题算力底座如何从“能跑模型”进化到“天然亲和Agent”这不是三个独立的议题而是从硬件到软件到开发者的一整条技术链必须在Agent前夜完成的一次系统性重构。超节点让几千上百个NPU之间拧出一股更强大的力量Chatbot时代序列长度约4KKVCache命中一次就够NPU之间的通信压力不大也是可控的。但进入Agent时代推理链路拉长到接近1M tokensKVCache需要跨NPU频繁跳跃。这时候问题就不仅是“带宽够不够”而是一个架构级命题——NPU和NPU之间怎么通信直接决定了系统能不能跑得更好。传统方案下每个NPU挂载独立内存跨NPU访问要走消息语义也就是send/recv那一套单次通信在微秒级。昇腾超节点天然亲和Agent负载。而判断超节点的核心标准其实只有一个即“是否实现了全域内存统一编址”。在这里昇腾950芯片的架构创新实现了SIMT与SIMD双编程模式的一体化融合在三件事上同时做到了这一点。一是内存语义的革命。基于灵衢互联协议和总线控制器AIC/AIV通过MTE指令直接访存远端内存无需拷贝。对比传统以太网在基于灵衢互联的超节点架构下MTE指令一个操作就能完成。其中差的不是量的优化而是质的重构。二是全域内存统一编址。全局单一虚拟地址空间下NPU和CPU直接用虚拟地址访问任意位置无需改代码、无需路由、无需拷贝。KV Cache实现全局共享超长上下文无缝扩展。三是内存池化带来的效率跃迁。通过片上内存和DDR的分层池化能力以查代算KV Cache查询命中率大幅提高。在LLM、推荐、Engram等典型场景查询时延降低3到4倍训练和推理吞吐相比传统集群提升3到4倍。三层叠加通信RTT时延压缩到了3微秒带宽更是达到TB级。这才是超节点的真正价值——并非“堆更多的NPU”而是让每一个Token都更高效、更经济。所以这次峰会给出的核心判断很直接互联能力决定超节点能力系统综合性能取决于超节点规模与单芯片性能规格的乘积。那么当互联带宽达到T级超节点要做的就不是“堆更多的NPU”而是重新定义芯片之间怎么通信。但物理上限只是入场券。真正决定算力生态命运的是硬件造出来之后的又一核心问题软件的门槛有多高开发者真的愿意来吗昇腾要走自己的路吸引开发者的关键是开源但开源这件事的底层逻辑已经变了。过去很多硬件的所谓“开源”是在围墙外开一扇窗——你能看到代码但不能改核心层更不能参与路线决策。这是“开放姿态”不是“开源生态”。为什么要计较这个区别因为开源和“看上去开源”打开的是两种完全不同的生态前景。真开源意味着开发者敢在你平台上持续投入——代码他能改、路线他能参与、技术迭代更新不会某天突然停止。假开源则意味着他永远得留一条退路做的每一行优化都可能白费。而在Agent时代当软件需求开始井喷、新场景以周为单位涌现开发者选择哪个生态建基础设施本质上是信任——信任这个平台不会因为封闭而让他走回头路。所以“开放姿态”能吸引围观“开源生态”才能留住人。因此昇腾这次在开源开放的道路上走得更彻底其核心不同就在于它正在构建一个完整、高效、开放的算子开发体系让开发者无论从哪个入口进来都能找到自己的路径。追求极致性能的工程师可以用Ascend C做细粒度控制如计算、访存、流水每一步都可调。同时昇腾还推出了Tensor API、支持Host-device混合编程、新增CCU通信能力。而注重快速创新的AI算法工程师则可以用TileLang或Triton——这两个主流开源生态接口已经实现了100%兼容性能达到Ascend C的0.6到0.9倍开发周期压缩到一周。目前更支持超600个Triton算子和300个TileLang算子。当然想在性能和效率之间找甜点区的开发者还可以选PyPTO。此外在这套多路径算子编程体系的另一端CANNBot 算子智能体则是把“最后一公里”也打通了。它将微架构优化经验融入技能库单个Vector算子生成仅需3小时从生成到部署全流程1天相比传统人工开发效率提升5倍以上。同时配合覆盖22类典型算子的评测集以及内置了4000多个评测点的自动化验证体系让开发者完全不用再从零摸索。以上加上AscendNPU IR编译底座的全面开源、联合30余家企业与高校共建的15个以上生态算子库昇腾正在向外界与开发者们抛出一个关键的橄榄枝——在这里从零写一个算子已经不需要“专家身份”了。在「智能相对论」的视角中开源的真正分水岭从来不是放出了多少代码而是开发者能不能在昇腾上从头写一个算子。现在答案开始变成了“能”。当然开了门是一回事让人留下来又是另一回事。这取决于第三个维度——开发者体验。开发者体验的飞轮已经全面转了起来过去一个模型从想法到部署的路径需要调研生态兼容性、手工适配算子、搭建验证环境、手动量化、部署调试等结果下来周期往往得按周来算而且每一步都需要全方面能力而“全方面”就意味着门槛。但是我们在DeepSeek-V4-Flash的昇腾实际部署中却看到了不一样的路径——1分钟就可以完成模型状态检索、一天内完成适配再经过小时级的自动验证和量化后30分钟就可以输出部署服务和模型文档。相较于传统手搓效率提升4倍如果考虑环境差异因素那就远远不止4倍了。这是如何做到的不是工具变多了是昇腾把“专家经验”变成了“系统能力”。具体来看我们发现有两套机制正在驱动这个变化的实现。第一套是Skills体系。4000多名昇腾工程师多年调优积累的经验、踩过的坑、验证过的最佳实践在这里被结构化沉淀为200多个可调用的Skills模块。它们兼容Claude Code、Codex、OpenClaw等主流Agent平台两行命令就能调用。以前要找对人才能解决的问题现在Skills里直接就有了。第二套是Agentic工作流。如今开发者只需要描述意图7个基础Agent自动编排接力调研、适配、优化、部署全流程自动化。以前是“人找工具”现在直接成了“工具找人”昇腾从根本上改写了开发者的工作范式。以上我们所看到的更多是从技术层面来拉升开发者体验。但是若要开发者体验的飞轮全面转起来或许光靠技术还不够昇腾又进一步给出了两套新体验。一是零成本的试错空间。一键自动部署、平均两分钟跑通首个Demo、上万卡算力资源投放支撑开源社区——这里要解决的不仅是算力成本更是“第一次尝试”的心理门槛。很多开发者不是不想用新平台是怕花了时间还跑不通。在这里昇腾把“试一试”的成本大幅降低本质上就是在消除这个心理阻力。二是可兑现的职业回报。联合头部互联网企业打造三层认证体系附带简历推荐、大厂实习等权益昇腾正在让“我能用好昇腾”这件事本身具有商业化的职业流动性。不难想象开发者留在一个生态里从来不只是因为工具好用而是因为他在这里积累的技能能换取实打实的外部回报。正视这一需求远比想象的要重要。那么这两样东西叠加之后传递给开发者的信息就很清楚了——来昇腾不需要从头开始。不管是对于开发者还是对于昇腾飞轮已经全面转起来了。写在最后在超节点巅峰对话直播中我们看到了一个来自产业端的判断“当智能生产软件的方式变得更高效人类对软件的需求会井喷。以前的软件太昂贵很多需求被压抑了。”对应来说Agent时代不仅在消耗更多Token它还在创造过去根本不存在的新需求——软件不再是标准化产品的复用而是每个人、每个场景的即时定制。这种需求一旦释放对算力的渴求不再是线性的而是爆炸式的。正如Anthropic联创Jack Clark的判断2028年Agent可能进入自主进化届时Token消耗将进入非线性增长通道。两条线指向同一个结论Agent时代的到来是不能等的。你不可能等Agent全面爆发之后再补架构的课、开软件的源、降开发者的门槛——那相当于堵车的时候才开始修路。因此回过头来看昇腾在峰会上铺开的三件事本质上是对这一判断的三重回应。首先超节点重新定义了NPU之间的通信范式让Agent时代的算力消耗不再被延迟墙锁死。这里为Agent时代打好硬件基础。其次CANN的多路径算子编程体系加CANNBot让任何一个开发者都能在昇腾上从零写出高性能算子。这里为Agent时代夯实软件能力。最后Skills体系和Agentic工作流把4000个工程师的经验打包成每个新手的起点。这里为开发者们铺好“好用易用”的路径。三道能力叠加在一起也就解释了昇腾今天要做的事不是在应对当下而是在对标一个还没到眼前、但已经在路上的Agent时代。*本文图片均来源于网络此内容为【智能相对论】原创仅代表个人观点未经授权任何人不得以任何方式使用包括转载、摘编、复制或建立镜像。部分图片来自网络且未核实版权归属不作为商业用途如有侵犯请作者与我们联系。•AI产业新媒体;•澎湃新闻科技榜单月度top5;•文章长期“霸占”钛媒体热门文章排行榜TOP10;•著有《人工智能 十万个为什么》•【重点关注领域】智能家电含白电、黑电、智能手机、无人机等AIoT设备、智能驾驶、AI、、、AI、AI、AR/VR、、开发者以及背后的芯片、算法等。