5 月 25 日至 29 日面壁智能与 OpenBMB 联合举办「端侧大模型开源周」每天解锁一个端侧大模型的杀手锏。端侧大模型的顶峰不只在冰山一角而在整座冰山。今天是开源周的第二弹端侧文本小钢炮 MiniCPM5-1B。今天面壁智能联合清华大学、 OpenBMB开源社区正式发布并开源最新一代端侧文本基座大模型——MiniCPM5-1B。MiniCPM5-1B 再次刷新模型的智能密度上限仅以 1B 参数规模在国际知名榜单 AA-Index 上超越了所有 2B 参数以下模型相比 3 个月前发布的 Qwen3.5-2BMiniCPM5-1B 不仅效果更优参数量还减少了一半。这一结果进一步验证了我们持续观察到的密度定律大模型的智能密度正在以约每 3.5 个月翻一番的速度持续提升。更小的模型正在承载更高的智能密度。据多个公开榜单成绩显示MiniCPM5-1B 的综合文本性能在全球 2B 参数规模以下的基座模型中排名最优在知识、数学推理、代码推理、工具调用等维度上MiniCPM5-1B 全面超越 Qwen3.5-0.8B、LFM2.5-1.2B-Thinking 等同尺寸的基座模型。在权威榜单 Artificial AnalysisAA上MiniCPM5-1B 的得分17.9分位于「小尺寸模型」榜单第一甚至超过 Qwen3.5-2B16.3分成为全球 2B 参数规模以内的最强开源基座模型此外端侧友好部署与运行门槛极低——INT4 量化后权重仅 0.5GB能跑在手机上、跑在浏览器里、甚至跑在你手边的几乎任何硬件上。即使只有 1B 参数规模能力强大的 MiniCPM5-1B 却一样能驱动大量有趣而酷炫的应用比如跑在每个人终端上的「桌宠」。更特别的是它的 Base Model 版本由面壁智能自主研发的 AI 训练框架 ForgeTrain 预训练完成。ForgeTrain 是全球首个完全由 AI 编写的生产级大模型预训练框架零人类程序员参与编写框架代码训练速度比英伟达 Megatron 还要快 10%。一个由 AI 亲手锻造的框架训出了2B 规模综合性能全球最强的文本基座模型——这表明「AI 制造 AI」的递回归智能RSI不是天方夜谭而是正在发生的现实甚至可能比 Anthropic AI 创始人兼 CEO Dario Amodei 预言的 2028 年还要更早实现。MiniCPM5-1B 现已全面开源包括模型权重、训练数据集与部署方案。以下是这款小钢炮的完整介绍。1B 参数驱动超炫「桌宠」MiniCPM5-1B 的综合性能表现进一步提升了行业对端侧模型的认知——10 亿左右参数1B规模的基座模型也能驱动许多强大而酷炫的应用。比如每个人都能养得起的「桌宠」跑在你的手机上、电脑上无论何时何地、有网没网都能贴心陪伴你左右➤ 项目地址https://github.com/OpenBMB/MiniCPM-Desk-Pet本项目基于clawd-on-desk项目二次开发随着训练技术和数据工程的持续进步1B 模型的能力边界已经被大幅推高。而它的部署成本几乎可以忽略——不需要 GPU 集群不需要云端 API一台普通笔记本、一部手机、甚至一个浏览器标签页就已足够。如果说百亿参数规模的大模型是需要机房供养的巨兽那 MiniCPM5-1B 就是每个普通人都能养得起的AI 「桌宠」——它就守候在你手边的一个终端设备里随叫随到只需很小的算力与 token「喂养」断网也能跑同时也比你预想的要聪明得多。这就是端侧 AI 真正激动人心的地方不是把云端大模型的能力打折后塞进小设备而是让适配端侧环境的小尺寸模型本身就足够强强到能独立驱动真实应用。根据公开数据集的评测MiniCPM5-1B 在同级参数规模内实现了综合性能最优在综合知识、数学推理、代码推理、工具调用维度全面超越同尺寸模型包括 Qwen3.5-0.8B、LFM2.5-1.2B-Thinking 等这不是某个单项上的微弱领先而是全面、系统性的超越。根据 AA 榜单的评测MiniCPM5-1B 的得分17.9分甚至打败了参数规模翻倍的基座模型包括 Qwen3.5-2B 思考模型16.3 分成为全球 2B 以下参数规模中综合能力最佳的开源基座模型此外MiniCPM5-1B 的模型体积虽小智能密度却极高MiniCPM5-1B 再次刷新模型的智能密度上限仅以 1B 参数规模在国际知名榜单 AA-Index 上超越了所有 2B 参数以下模型相比 3 个月前发布的 Qwen3.5-2BMiniCPM5-1B 不仅效果更优参数量还减少了一半。这一结果进一步验证了我们持续观察到的密度定律大模型的智能密度正在以约每 3.5 个月翻一番的速度持续提升。更小的模型正在承载更高的智能密度。高智能密度数据决定模型的上限1B 模型要达到出色的性能训练数据的质量比参数量更重要。MiniCPM5-1B 在训练过程中构建了一套分级数据治理体系将预训练数据按照质量从低到高划分为 L0 至 L4 五个等级每一级对应不同的清洗、筛选和质量控制标准。在此基础上研究团队针对三个关键语料方向开展了大规模的高质量预训练数据合成高知识密度中文网页语料高知识密度英文网页语料高质量数学合成语料面壁智能关于数据治理的核心理念是与其用海量低质数据灌出一个模型不如用精选高密度数据养出一个模型。在 1B 参数规模下每一条训练数据的质量都直接影响最终性能——这也是 MiniCPM5-1B 能够全面超越同级模型的关键原因之一。高质量合成数据集Ultra-FineWeb-L3将随模型一起开源供社区使用和研究。数据治理方法论详见技术报告arxiv.org/pdf/2602.09003AI 制造 AIMiniCPM5-1B 的 Base Model 版本由我们即将发布的 AI 训练框架ForgeTrain在华为昇腾上预训练完成。ForgeTrain 是全球首个完全由 AI 编写的生产级大模型训练框架——全部代码由 AI 生成人类工程师零代码介入在英伟达 H100 上训练速度超越英伟达自家的 Megatron 框架比 Megatron 快了 10%相当于训练成本下降 10%。MiniCPM5-1B 不仅凭借小巧的模型体积实现极高的智能水平更进一步验证了「AI 制造 AI」的路径可行性一个完全由 AI 编写的训练框架能够训练出全球同尺寸最优的基座模型。「AI 制造 AI」不再只是一个需要论证的学术方向而是已经在持续产出真实的、可验证的、性能领先的成果。ForgeTrain MiniCPM5-1B 就是一组最新的数据。端侧普适90% 设备均可跑端侧模型的灵魂问题只有一个用户手边的设备能不能跑MiniCPM5-1B 的答案是几乎都能。0.5GB——这意味着 MiniCPM5-1B 作为一个能力出色的文本大模型占用的空间比一部短视频还小。更重要的是运行环境的广泛兼容——有 GPU直接跑 FP16性能拉满。只有 CPU前不久面壁智能联合清华大学、OpenBMB 开源社区一起开源了自研的 CPU 推理框架ArcLightgithub.com/OpenBMB/ArcLight专门为纯 CPU 环境做了深度优化没有显卡也能流畅对话。连本地环境都不想配MiniCPM5-1B 可以直接在浏览器中运行打开网页就能用零安装、零配置。我们希望 MiniCPM5-1B 成为一个真正的零门槛端侧模型——不挑硬件不挑平台不挑用户。只要你想跑就一定能跑起来。一行代码唤醒你的 AI 桌宠一个模型再好如果部署门槛高、生态不兼容开发者也不会用。MiniCPM5-1B 从第一天起就围绕开发者友好来设计主流微调框架全覆盖支持 Llama_factory、ms_swift推理框架适配SGLang、vLLM、llama.cpp、ollama、Hugging Face、ArcLight自研 cpu 推理框架此外MiniCPM5-1B 还提供了配套的安装 skills。如果你正在使用 Claude Code 或类似的 AI 编程工具可以直接让它帮你完成 MiniCPM5-1B 的环境配置和部署——用 AI 装 AI一行命令都不用自己敲。你的下一只桌宠只有 0.5GB欢迎领养。MiniCPM5-1B 现已全面开源➤ HuggingFace 链接https://huggingface.openbmb.com/model/openbmb/MiniCPM5-1B➤ GitHub 链接https://github.com/OpenBMB/MiniCPM➤ ModelScope 链接https://modelscope.cn/models/OpenBMB/MiniCPM5-1B➤ GitCodehttps://ai.gitcode.com/OpenBMB/MiniCPM5-1B➤ 魔乐社区https://modelers.cn/models/OpenBMB/MiniCPM5-1B