Token指数连跌引发AI交易链震荡一张由Silicon Data统计的LLM Token支出指数图点燃了AI增长和账单失控的焦虑。6月11日该指数已连跌7天创下今年1月以来最长连跌纪录过去12天里有11天是下跌的。这个指数衡量的是全市场每使用100万枚Token平均支付多少钱可理解为市场愿意为AI“付多少钱”的晴雨表。它自去年12月以来翻了一番以上并在2026年5月前持续攀升但近期急转直下触动的是整条AI交易链。美国宏观策略师Andreas Steno Larsen在6月9日称这张图为“当前全市场最应关注的一张图”并警告如果Token定价持续走弱本轮周期中从内存到更广泛的硬件及数据中心交易可能宣告结束。不过华尔街的看法更为复杂和多面Token定价走弱可能并非单纯的AI需求见顶。指数下跌原因成谜需求见顶还是结构下沉这张图不能简单读成“AI没人用了”它量的是每百万Token的加权平均价格反映的是用户在用什么价位的模型。通过简单计算可知指数下跌有两种解释一是需求真的在萎缩二是用量在爆炸但用户在主动向低价模型迁移。这正是当前争论的核心指数下跌到底是需求见顶还是用量结构下沉Citadel证券发布《Tokenomics》报告认为AI落地的核心约束已从“模型能力”转向“成本与算力稀缺”用户正加速向廉价模型迁移。摩根大通TMT分析师Mark Schilsky则在6月11日把近期市场讨论概括为“AI账单失控了”同时该行认为当前的Token支出乱象只是“通往更高支出的最小减速带”。Citadel判断AI“性价比与稀缺性”更重要Citadel证券在《Tokenomics》报告中给出明确方向性判断核心论点是AI落地的核心约束已从“模型能力”转向“成本与稀缺性”。报告指出技术落地的核心不再是前沿模型理论上能做什么而是规模化实现AI运行所需投入品的价格与稀缺性算力、电力、冷却、内存带宽和推理预算都是限制条件。报告援引经济学原理认为价格的三大功能在AI领域同时发生。结论是未来最好的回报不会来自构建最强模型的公司而是来自降低AI成本、提升效率的公司。推理密集型前沿AI不会消失但会集中在少数有能力承担成本的大型企业手中对整个经济体而言在物理约束缓解之前更简单的模型可能是更具生产力的路径。低价模型改变账单结构AI使用或分层高盛One - Delta部门负责人Rich Privorotsky提到DeepSeek下调75%的定价小米MiMo接近99%的降价幅度基础设施瓶颈缓解正在触发价格战。Coinbase首席执行官Brian Armstrong预测未来12至18个月80%的AI工作负载会迁移到成本低99%的模型上只有20%需要极致智能的任务会继续留在前沿模型上。Hugging Face首席执行官Clement Delangue援引斯坦福大学数据称本地模型在真实世界查询中的准确率已升至71.3%且成本极低。这与Citadel的判断相接近即前沿AI不会消失但可能集中在少数能承受算力成本、具备研究深度、且能把高难度问题转化为规模化收益的企业手中。对更广泛的经济体而言在物理约束缓解前更简单的模型可能是更便宜的生产力工具AI使用可能走向分层高价值、复杂任务继续使用前沿模型日常任务、批量任务、低回报实验则转向便宜模型或本地模型。摩根大通优化账单不等于AI需求见顶摩根大通认为现在的账单焦虑可能只是AI需求早期阶段的小减速带一年后Token支出可能明显更高。如果每百万Token平均成本下降但美国公司AI付费渗透率仍在上升总Token用量在算术上就必须大幅增加即“单位价格下降”和“总使用量爆发”可以同时发生。企业内部情况类似已大量使用AI的公司会优化Token预算减少浪费还没完全上车的公司会因模型更便宜、更容易部署而开始使用。智能体AI还会放大Token消耗有中小企业案例显示业务agent化后每个任务的Token消耗变成原来的3.5倍。所以市场争论的关键不是“Token会不会继续增长”而是“增长的单位经济模型是否健康”。企业开始管账单定价模式生变企业端最先暴露的问题不是AI没人用而是用得太随意。Axios援引一位AI顾问消息称其一家企业客户近期单月在Claude上花费5亿美元原因是未对员工使用量设置上限。企业内部把AI使用量当作考核指标也产生了副作用如美国部分公司诱发“Tokenmaxxing”员工为刷高使用量让AI执行低价值任务。亚马逊旗下开发者平台Kiro曾设有内部排行榜“Kirorank”员工为刷榜让AI做无意义任务推高运营成本随后亚马逊要求员工“不要为了用AI而用AI”相关测试版仪表盘被下线并改用“归一化部署”指标追踪AI生成代码的实际价值。Meta内部也出现过类似情况。企业不是停用AI而是开始区分“有效Token”和“无效Token”。摩根大通提到Cloudflare推出AI Gateway这类产品目的是帮助企业控制Token预算OpenRouter等工具也长期存在本质都是在不同模型之间做路由和成本管理。定价端也在变化6月1日GitHub Copilot正式从按请求收费切换为按Token用量计费有用户称月度费用预计将从不到45美元升至超过847美元。GitHub首席产品官Mario Rodriguez称随着智能体AI兴起旧有定价模式已不可持续。Gartner分析师Arun Chandrasekaran称随着高级推理模型推高算力消耗更多企业将转向按用量计费过去靠固定订阅或补贴隐藏的成本正在被摆到企业财务表面。多空分歧硬件交易逻辑是否成立这场争论的终极问题是AI基础设施的投资逻辑是否还成立。多头依据是高盛的Jim Schneider测算到2030年代理式AI将推动Token消耗量增长24倍云服务商毛利率将在短期内转正Mark Schilsky也认为Token支出的短期乱象不会改变长期趋势。空头依据是高盛半导体分析师Jim Covello认为当前产业链繁荣是以牺牲上游消耗为代价的几乎所有价值都流向了半导体公司这种状况不可持续投资人Tommy Shaughnessy警告AI大厂利润率深度为负一旦企业直面按量计费的真实价格支撑GPU采购和模型训练的资本流动将面临逆转。近日Anthropic CEO Dario Amodei、博通总裁Hock Tan、《大空头》原型Steve Eisman等也谈到企业目前对AI工具存在过度支出问题随着成本意识增强和计费模式转向按Token收费未来更需要看实际投资回报率。社交媒体上也有不同声音有用户指出“六天连跌去年在采用高峰期发生过四次”“更便宜的模型反而会加速部署因为成本门槛降低了”也有人反驳“不管多便宜每次新模型发布都会指数级消耗更多Token”。目前这场争论没有定论但Token支出的边际变化通过GPU算力、DRAM内存及数据中心需求的传导链条直接影响英伟达、存储芯片厂商及云服务商的资本开支预期这张图投资者不得不盯着看。