DeepSeek V4:从模型能力到算力自主的双重突围
DeepSeek V4从模型能力到算力自主的双重突围最近DeepSeek V4 在技术圈引发了两次截然不同但 equally important 的讨论。一个是来自实战的模型能力验证另一个是来自战略层面的算力自主突破。这两条看似独立的线索实则指向同一个结论DeepSeek V4 不仅是一次模型升级更是中国 AI 生态的一个关键拐点。第一条线索从倒数第一到碾压全场背景7 个 AI 代理的创业大赛Reddit 上有一个有趣的实验「7 个 AI 代理用 $100 构建创业公司」。这不是选择题考试而是真正的代码实战——从零开始构建可运行的产品。这种设定让模型的「真实能力」无处遁形。V3 的灾难级表现DeepSeek V3 在这场比赛中排名倒数第一指标数值会话数24 个提交数136 次网站状态404 错误最大问题卡在 Stripe 集成循环没有 API key 却反复修改代码文件命名出现了Ill now output the SEARCH/REPLACE blocks.scripts/build.js这样的文件帮助请求零次最致命的是其他获胜代理都会主动请求帮助但 V3 从未意识到自己需要外部资源。这暴露了一个核心问题——缺乏「知道自己不知道什么」的元认知能力。V4 Pro 的涅槃重生比赛作者用 V4 Pro OpenCode 给 DeepSeek 一次翻身机会。清空仓库从头开始。结果令人震惊V4 Pro 的第一个会话就成为全场最佳 Day 1。单次会话成果头脑风暴 10 个创业点子5 维评分系统化淘汰选定Spyglass竞品情报工具$29-199/月建成 10 个页面落地页、定价、博客、隐私、404 等立即提交帮助请求域名、Stripe API key三个会话后上线网站、演示工具、3 篇 SEO 博客、数据库 schema、爬虫设计、告警系统。核心差异分析能力维度V3V4 Pro规划能力无直接写代码先分析 10 个方案再动手元认知不知道自己不知道知道边界主动求助架构思维无先设计 schema 和系统架构错误恢复在错误方向持续投入遇问题立即调整结论V4 Pro 展示了从「能写代码」到「能做工程」的进化。第二条线索从 NVIDIA 依赖到华为生态事件背景另一条线索来自 r/LLMengDeepSeek V4 不只是「优化」运行在华为芯片上而是实际使用 CANN华为的 CUDA 替代品在华为芯片上进行训练。这意味着什么这不是一个技术 tweak而是战略层面的基础设施转型。具体进展根据华为 Ascend 官方披露的信息阶段状态说明推理部署✅ 已完成V4 可在华为芯片上运行继续训练CPT✅ 已完成V4-Flash 在 A3 64 卡超节点完成 CPT吞吐 1100 tokens/s全量预训练 进行中目前仍依赖 NVIDIA预计下半年 950DT 量产后解决官方访谈华为在 B站发布了 DeepSeek 开发者访谈https://b23.tv/w0NzhPP确认了这些信息。为什么这很重要这不是妥协而是平行生态的起点早期信号表明 V4 依然保持高竞争力。这意味着中国正在构建一个不依赖 NVIDIA 的完整 AI 技术栈——不是 fallback option而是 parallel stack。Jensen Huang 的预言正在验证NVIDIA CEO 在 Dwarkesh 播客中预言出口限制会迫使中国建立自主算力生态。当时被 HN 和 Reddit 群嘲现在正在成为现实。从 inference → CPT → pre-training 的渐进路线这是一条务实的路径先解决推理再解决继续训练最后攻克全量预训练。下半年 950DT 量产后可能实现全栈中国算力。双重突围的战略意义把两条线索放在一起能看到更大的图景技术层面模型能力突破从 V3 的「只会写代码」到 V4 的「能做工程」元认知觉醒知道何时求助、如何规划、怎样设计架构工程效率跃升单次会话产出可用产品骨架战略层面算力自主突破从 NVIDIA 依赖到华为生态全栈整合模型 芯片 部署的紧密耦合渐进式替代推理 → CPT → pre-training 的务实路线合并视角DeepSeek V4 的意义不在于「更强」或「自主」而是在这两条线的交汇点一个能在实战中碾压对手的模型同时正在构建不依赖美国制裁的技术栈。这不是两个独立事件而是同一个战略的两种表达。对全球 AI 格局的启示硬件-模型的深度耦合如果 V4 真的实现了与华为芯片的 co-design我们可能正在走向一个模型不再硬件中立的世界。这改变了什么过去模型训练一次可以在任何 GPU 上部署未来模型可能与特定芯片生态深度绑定迁移成本更高平行技术栈的形成中国正在加速构建模型层DeepSeek、Qwen 等芯片层华为 Ascend、昇腾系列软件层CANNCUDA 替代品部署层国产云平台这不是 fallback而是parallel AI infrastructure。制裁的反噬效应Jensen Huang 的预言核心是制裁不会阻止中国只会迫使中国建立自己的生态。一旦这个生态成熟NVIDIA 可能失去整个中国市场。这不是「制裁有效」而是「制裁催生了竞争对手」。一些争议与质疑实战测试的变量问题第一个帖子有人指出V3 用的是 AiderV4 Pro 用的是 OpenCode。变量太多难说是模型进步还是工具差异。这个批评有道理。但无论如何V4 Pro 的表现确实展示了「成熟编码代理」应有的样子。华为芯片的量产能力第二个帖子有人问中国能否大规模生产这些芯片这是关键问题。技术突破需要量产支撑否则只是实验室成果。下半年 950DT 的表现将是一个重要观测点。信息真实性也有评论质疑这是「营销炒作」。但华为官方访谈的存在以及具体的吞吐数据让这个质疑显得不够有力。总结DeepSeek V4 两条线索的交汇揭示了中国 AI 发展的一个重要拐点技术层面从「写代码」进化到「做工程」——元认知、规划、架构能力的觉醒战略层面从「依赖 NVIDIA」转向「华为自主算力」——推理、CPT、预训练的渐进路线这两条线不是孤立的。一个能在实战中碾压对手的模型正在构建不依赖制裁的技术栈。这可能是「平行 AI 时代」的开端。相关链接创业大赛原帖华为芯片原帖华为官方访谈比赛实时看板