王小川All in医疗大模型百川智能M4与“百小医”能否开辟新赛道一年前当整个大模型行业热闹非凡大厂和创业公司轮番进行“轰炸式更新”过去半年里平均3天就有一个新版本的通用大模型面世时王小川却带着百川智能来了一次激烈的“大刹车”大幅缩减通用模型团队关闭金融等多条行业线All in医疗大模型。王小川表示“如果没有转型继续走主流道路你也会有同等程度的焦虑。”这次转型让他真正回归到从创业第一天就最想做的事情造AI医生。过去3年里百川逐渐从“要做中国最好的基础大模型”转向“同时押注多个落地场景”、“做C端超级入口”、再到如今的“只做医疗”团队规模不断缩小部分合伙人离开原定的上市节奏也因而延迟。这看似颠簸的路走对了吗在新产品发布前夕见到王小川时发现他的状态反而更坦然了。他对《智能涌现》说“继续卷通用模型走主流道路那是一种选择即使上市了很风光但焦虑也不会减少半分。”比起当时公司内外巨大的不理解以及选择非共识道路的孤独感他更难以接受的是“公司快成立两周年了却不知道自己到底在干什么创造什么价值。”在互联网上一个十年医疗并不是一个好生意——商业化路径漫长反馈周期以年计。从大厂到初创公司即使投入高达数十亿元成功跑通PMF的产品都寥寥无几更别提获得商业上的大成功。当时很多公司的选择是给医生提效或是打通挂号、药、保险的链路以此跑通商业闭环。但王小川认为这些都不是当下最重要的事。他想明白一点百川的C端产品必须以患者为中心要增加医生的供给“我们要造更多的医生”。在这个思路下百川在医疗的B端场景中有了更多落地进展在北京儿童医院百川两款AI儿科医生已在院内多学科会诊中正式“上岗”。在很多诊疗方案中AI儿科医生与专家会诊结果吻合率达95%并开始向河北省150余家县级医院下沉。同时在C端百川新上线的Agent产品“百小医”则在App和微信生态中共同提供服务。“百小医”就像一个“AI家庭医生”不只是提供问答会在患者就医前准备给医生的病情梳理做处方分析管理病例还会定时提醒你吃药、做检查等等。王小川并不接受“医疗是更长、更慢的一条路”这个观点。“这个想法本身就是一种时代惯性。”他的逻辑是如果Coding Agent能在几个月内成为史上增长最快的应用场景就意味着很多旧边界已经被打破。从通用大模型的白热化竞争中抽身All in医疗——对这个选择王小川坦承“我的选择不一定对也不一定错但我觉得AI时代只要交付给用户足够重要的价值商业化会是水到渠成的事。”对于那些依然身处在同质化竞争中的AI公司来说王小川的选择至少是一条值得认真审视的路径去找一个真正相信的问题然后用足够长的时间回答它。以下是王小川与《智能涌现》的对话All in医疗有它的代价《智能涌现》今年年初你们发了医疗大模型M3今天再接着发布新一代医疗大模型M4还有新Agent产品百小医核心提升有哪些王小川M4是我们的闭源医疗大模型通过API提供服务一个核心亮点是走Agent架构从简单的对话走向临床里面有基于患者全生命周期的记忆能力。另外的突破有几个幻觉减少、循证能力增强——我们把指南做原子化拆解甚至把专家共识也纳入进来提问能力也有了很大提升——这个对医疗场景很关键我们每提升两个点的提问能力就能增加一个点的诊断准确率。现在在肿瘤这类复杂场景里M4能自己跑完整个Agent workflow——收集数据、校对冲突、调用基因变异数据库、出诊断建议。M4能够自主决策不同的子项肿瘤的情况它甚至能查基因库像龙虾一样做到主动提问和主动管理。“百小医”是百川的新To C产品形态是一个在App和微信上的bot可以主动提供处方、病例分析做全周期的健康数据管理。《智能涌现》你所指的M4模型“做得好”是怎么定义的王小川在OpenAI发布的HealthBench测评集上我们在Hard和Professional两个子集里都是最好的模型。我们没有对benchmark做特殊训练所以模型表现好就是好。这个评测集有5000个医患多轮对话场景262个人类医生编写了近5万条评价规则不是刷榜能刷出来的。《智能涌现》今天最大的行业共识是Coding百川却在一年前就选择不走通用模型路线All in医疗当时怎么想的王小川AGI大叙事没问题但这里面肯定有泡沫泡沫褪去之后珍珠会留下来。怎么去找这个珍珠大家会押注各自的生态位。做百川到现在我想做的东西其实没什么变化——当初的初心就是做生命模型造医生ChatGPT的出现是这个目标的助力。我之前想得太早又想得太远了。2023年的时候你跟大家讲造医生、做生命模型会发现理解的人不多。《智能涌现》但在那个节点不卷通用模型是一种脱离主流赛道的选择你有过担忧吗王小川如果做主流你也会有其他恐惧。我不是说我现在做得特别好只是主流也有主流的问题不同选择有各自的代价。我们在2025年4月大调整后开始专注做医疗也是因为当时临近百川成立两周年我有巨大的紧迫感。当时公司特别重从模型、医生到生命模型再到商业化都在做。当时就是不知道自己在干嘛在创造什么价值。《智能涌现》这个决定的代价是什么王小川很多人在那个时候离开。有同学觉得做通用模型才是对的道路投资人也有意见。当时有各种曲解比如有人传小川可能对上市没想法无所谓反正自己财务自由了。《智能涌现》有创业公司也会选择先不考虑这么远先赚到钱养梦想上市也是一种路径。王小川我们那个时候也不缺钱啊。上市了然后呢《智能涌现》百川的一些前高层以及你的一些投资人他们都很难理解你的突然刹车。王小川可以想办法把ARR、收入做起来但在当时也不是我最想要的。第一你就没精力做业务了你拿到收入跟你真正交付一个好的产品或服务不是一个维度的事。第二业务单点还没突破的时候搞矩阵化管理是特别危险的事当时销售、产品、技术每个人身兼数职为多个产品服务。这种状态和我对公司想实现的价值的判断是没法match的。如果我从内心就不相信这个事情的话也很难做好。《智能涌现》那你怎么跟投资人解释王小川很难解释。投资人肯定想上市我只能继续把现在的事做好。《智能涌现》4月调整完之后团队规模、架构包括百川整体的工作方法有什么改变王小川我们人数压缩到不超过300人层级扁平现在就10多个人给我汇报。我们现在就分几大块一是做医疗模型本身二是以Agent的形态做AI医生产品三是做医院体系的合作通过AI医生把医院、卫健委等等体系联系起来我们的目标是用AI做四级诊疗。《智能涌现》所以你对这一段探索过程的反思会是什么王小川最大的反思是不该开那么多条线。你要么做通用要么做医疗两个脚一块走是不行的。同时做商业、做技术、做医疗一开始很难负担得住。我们不是想取代医生《智能涌现》“百小医”为什么会在微信里做AI医生bot王小川Bot就是你微信上的一个朋友——你问他“该不该去医院”他说不用你先观察过两天他会主动来问你“有没有变严重”也会提醒你吃药能够对个人和家庭健康进行主动和个性化管理。日常的健康管理不是一两次问诊能解决的是长期陪伴助手类APP很难承载这种持续性。《智能涌现》很多人可能会问用百川的助手看病和用豆包看病体验差距大吗王小川我们在专业性文献的引用、溯源上会比通用AI助手更丰富。但坦白讲无论是什么领域问答场景的体验很难形成断代式的差距。在产品形态和体验上。这次发布的“百小医”是走双端架构APP端负责提供严肃的就医决策——针对病例、处方做分析报告、对比微信bot端负责日常的提醒和执行这是一个会主动跟进你健康情况的AI医生。另外我们在底层做了一套永久性的记忆存储不走上下文那套模式。这是一套有数据库结构的存储——用户上传的体检报告、对话里提到的症状病情、血压、用药情况都能被记录做全生命周期的健康数据管理。记忆能力在医疗场景特别重要通用模型很多时候根本不知道该存用户的什么数据。《智能涌现》如果和同样是做医疗方向的阿福相比呢王小川我们的切入点不一样。我们做的是主动管理——你问完之后过两天它会微信上主动来问你“有没有更严重”提醒你吃药、该复诊了。这种持续跟进的能力App很难承载用户一上手就能感觉到不同。《智能涌现》美国AI医疗赛道的头部公司OpenEvidence估值已经120亿美元了他们做是面向医生的AI临床决策支持工具用顶刊论文辅助医生做诊疗判断。你们在中国能走这条路吗王小川中国和美国的医疗市场有很大区别给美国医生提效能直接多赚钱——他一天看10个病人变成看15个这是保险公司付费的按人头算收入直接多50%。但中国医生平均一天看50 - 80个病人已经够忙了提效的空间几乎没有。《智能涌现》那在中国做AI辅助诊疗动力在哪儿王小川中国优质医疗供给现在是严重不足直接用通用AI助手给患者做AI咨询这是很难进入医疗体系的还容易带来新的医患矛盾——今年已经有三甲医生和我反馈30个病人里有25个都带着豆包来“对线”会对医生产生质疑。现在国家在倡导主动健康管理和强基层如果AI能融入医疗体系、做分级诊疗的前置环节这是政策认可的方向也是新物种的机会。《智能涌现》那百川是怎么提升医疗模型的智能的王小川我们做的不是传统意义上的训练数据更多是做强化学习的评价体系。医生标的不是正确答案是帮我们建立奖励函数做评测集——什么样的提问路径最终能导向好的诊断结果。《智能涌现》我们听说你们请了很多医生做数据标注这部分很花钱。王小川跟医生打交道做数据标注真的很难但不是钱的问题是说服他们、建立评价体系、让团队跟他配合这些都要摸索没人做过。《智能涌现》既然是全新的做法那一定也会有人反对吧王小川不少人觉得在中国做医疗AI要跟医生合作要用医生的病例数据造AI分身。《智能涌现》什么样的AI分身王小川就是很多AI医疗公司的做法——跟某个医生合作拿他的病例数据训一个模型本质上是复制这个医生的经验。肾病专家造个肾病模型肿瘤专家造个肿瘤模型每个人都想巩固自己的学术权威。你见过一个医生用另一个医生做的AI吗《智能涌现》你们的“造医生”和这种做AI分身有什么不同王小川分身是模仿学习——把病例喂进去让AI学着像某个医生那样看病。但你拿病例训出来的模型它会提问吗这代大模型造的是“人”不是上一代那种用来看CT片子的模式识别模型。我们走的是强化学习的路模拟患者激发模型提问用最终的诊断结果做奖励函数反向训练它该怎么提炼病例数据问什么问题、该怎么推理。不是复制某一个医生而是让AI学会医生思考的过程本身。《智能涌现》所以你们做的事情本质上是把医生拉下神坛。王小川这是个危险的评价。我们不是要挑战医生的权威而是要帮患者明明白白看病以患者为中心让他拥有知情权和决策权。《智能涌现》面对医生你怎么一句话解释百小医的价值来消解这种可能存在的对抗王小川我说我能帮你做随访。这是一个共赢的场景很多病人去看完病加上医生微信回家之后问问题等医生的回复往往要等到大半夜因为医生太忙了。院后随访、复诊提醒、用药管理等等都是这样的场景现在用AI医生就能帮医生分担这部分需求。《智能涌现》你们的目标用户是谁王小川我们概括为“一老一小”——老人慢病多小孩咨询多这是最高频的场景。比如我把我妈和AI医生拉进群AI医生跟我妈对话的时候也跟我沟通。就像家里请个保姆不是只跟老人在一块他也跟你有交流。医疗是条更慢的路这是上一代的认知《智能涌现》很多人会说医疗是一个反馈路径很长的赛道。先用通用模型赚到钱再长期养医疗这条线不是更稳妥吗王小川我不接受这个叙事这里面有很多误解。医疗慢这是过去的经验形成的认知不代表今天。今天太多事情跟过去的规律不一样了。几个月时间一个产品就能上亿用户、上亿收入规模。那为什么我们还要用老的方式看医疗百度三分之一的收入来自医疗一天医疗相关的query量是上亿级别的。蚂蚁阿福也有3000万月活了。需求一直在那里只是以前可能是我们还没做好供给。《智能涌现》你们原来做To B、To G到现在做To患者这个变化是怎么发生的王小川我确实有过很多反思但我始终相信AI能造医生这个信仰从第一天就刻在骨子里。我们在中间走过弯路比如尝试让医生认可就先做一个AI工具帮医生看片子、写论文也试过做院内先打进医院体系里但这些路径都太长了。大概去年4月我们就想清楚了To患者才是我们主线这条路其实也是To医生。医生和患者不过是有不同需求的C端用户。《智能涌现》比如挂号、买药这些也是C端用户的刚需你们会做吗王小川帮你挂号、帮你买药那些是执行是上一代互联网干的事偏匹配、链接。我们不是不能做但核心还是想做决策——比如你有三个处方选哪个去什么科室要不要去医院执行更直观、更有获得感但帮你做选择判断是更难也更宝贵的事。《智能涌现》但蚂蚁做阿福后续可以把挂号、卖保险、卖药联系起来这样不会比你们在商业化上跑的更快吗王小川他们是从“药”和“险”出发补前面的问诊环节而我们是从“医”这端开始切的。站在药的思路去做医跟独立做医立场不一样做出来的东西也不一样。《智能涌现》短期内你希望能够达到什么产品和业务上的目标什么时候会考虑商业化王小川第一步是上岸——去年还有朋友问“百川还活着吗”得先让大家看到我们在做什么第二步是在不同场景里积累技术口碑和用户体验的口碑。商业化不是当下的重点。考虑早了动作会变形。你看智谱到今天也不做那么多To B和To G了大家都在卖Token。上一代常用的那套做法现在反而变成了包袱。语言模型、世界模型、生命模型《智能涌现》有媒体说你是“最孤独的AI创业者”现在你会觉得孤独吗王小川自己选的路跟大家不一样你不就孤独吗从资本到人才上都会变得更难。羊群效应决定了大家还是会选更主流的道路这是正常规律。《智能涌现》你怎么看现在AI应用创业公司的处境王小川在做模型之外很多创业公司没啥可干的了。做Agent的公司壁垒在哪倒腾点Anthropic的Token配置配置方案今天能卖明天能不能卖不知道。不是说Agent没前途而是它可能不是适合VC投的生意——赚小钱的公司很多但长大变难了。之前我和一个互联网大佬聊他提到一个”去中化”的趋势——这个“中”是指中型公司。要么做巨头要么做小而美的公司。《智能涌现》说到巨头你去年初就公开说看好Anthropic那时候Coding还没爆发你的判断怎么来的王小川我觉得是Dario对技术的理解很深刻这是一种审美层面的判断。后来事实也验证了——Claude在代码场景里确实打出来了。《智能涌现》那其他呢OpenAI你怎么看王小川我觉得Anthropic和Google都会比它强。《智能涌现》你看到什么现象让你有这个判断王小川第一Sam Altman还带着上一代互联网的思路——强推应用、追DAU、做订阅甚至Sora还想做社交。他的策略是应用大于模型本身跟Anthropic不在一个技术审美上。第二做To CGoogle会比OpenAI强。Google有搜索、有安卓、有YouTube出口能力和数据能力都更好我觉得Google是以后会有代际的爆发和飞跃。《智能涌现》哪方面的爆发王小川我觉得Google会走出新的架构——不只是语言模型代表的智力模型还有物理模型、生命模型等等新路线。 其实Demis HassabisGoogle DeepMind CEO的心头最爱就是生命模型后来才转到LLM这个战场来的。以后Google肯定既做语言模型又做生命科学。一个公司能同时做AI、做无人驾驶、做蛋白质折叠——从人才储备、数据厚度、算力规模上Google都是顶配。《智能涌现》所以你对大模型演变的终局怎么看王小川我们做模型有三步走。第一步是智力模型就是语言模型——这里的语言包括数学语言和代码语言代码很重要待会再讲。第二步是物理模型或者叫世界模型做具身智能。第三步是生命模型比材料科学更往前走——材料科学讲的还是简单世界而生命有超越复杂性的终极问题。生命模型是我从第一天就想做的事。这三条线最终会合流——理解语言、理解物理世界、理解生命系统这才是完整的智能。而且你想工作开始被AI替代之后人追求什么创造发明发现、健康、快乐——最后就这三个事。长生不老、健康、每个人活得更有意义这些问题最终都指向生命模型。