零成本接入 GLM-5.1!Modal 平台免费不限量 API 对接 Claude Code
JeecgBoot AI专题研究| Modal 平台 GLM-5.1 免费不限 Token 接入 Claude Code起因Claude Code 限流太烦周五下午赶重构任务Claude Code 连续弹429 Too Many RequestsCoding Plan 在高压场景下扛不住。刷 Twitter 看到 Modal 宣布一件事把智谱 GLM-5.1 挂到自家 GPU 集群免费开放 API 端点只按 QPS 限速Token 总量不封顶。半小时跑通 Claude Code 接入就有了这篇笔记。一、为什么这对组合香不限 Token 总量只限 QPS单账号 3-5 QPS—— 一个人挂一整天够用OpenAI 协议兼容—— 绝大多数 AI 编码工具能直接接零信用卡零额度—— 注册完直接拿 Key对重度用户就是天然的主力卡 备胎卡。二、拿 Key1 分钟打开 modal.com走 GitHub / Google OAuth 注册邮箱注册要人工审核进 modal.com/glm-5-endpoint左侧点Create token起个名字Key 只弹一次立刻存好同时记下Example usage里的baseUrl和模型 ID端点https://api.us-west-2.modal.direct/v1/chat/completions模型 IDglm-5-endpoint三、接到 Claude CodeClaude Code 走 Anthropic 协议Modal 走 OpenAI 协议中间需要一个协议转换网关。Modal 官方已经写好了modal-jazz。gitclone https://github.com/modal-projects/modal-jazz.gitcdmodal-jazz/frontends/claude pipinstall-rrequirements.txtexportMODAL_API_KEY你的 keypython app.py# 监听 127.0.0.1:8000然后给 Claude Code 配环境变量exportANTHROPIC_BASE_URLhttp://127.0.0.1:8000exportANTHROPIC_AUTH_TOKEN任意字符串exportANTHROPIC_MODELglm-5-endpoint重启终端跑一次claudeModal 控制台能看到请求就是通了。更深的用法MCP、tool use、cache_control参考 Claude Code LLM Gateway 文档。四、OpenClaw / OpenCode这俩本身就走 OpenAI 协议不用网关中转改配置文件就行{llm_backend:{url:https://api.us-west-2.modal.direct/v1,api_key:你的 Modal Key,model:glm-5-endpoint}}参考仓库modal-jazz/frontends/openclaw · modal-jazz/frontends/opencode五、两天用下来的几个体感首 Token 延迟 500-800ms比 Claude Sonnet 略慢但可接受CRUD、SQL、单测没问题跨文件大重构偶尔漏调用点上下文别超 64k后段准确率会掉单机单 Agent 最稳并发多了会触发限速us-west-2 节点偶尔 502等十分钟或切回 Claude小结主力继续用 Claude Code 原厂但被限流卡住时Modal GLM-5.1 modal-jazz 是当前性价比最高的应急通道五分钟配完不限 Token免费。AI 编码工具用到生产级别的人都懂一个道理永远给自己准备一条 B 路线。本文为 JeecgBoot AI 专题研究系列文章。