上周三我把项目里的 Continue.dev 从 GPT-5.5 升到 GPT-5.6 Sol改完 config.json 信心满满结果用了两天才发现——它一直在跑 5.5。没有任何提示响应正常就是模型没切过去。最后靠在 Python 里检查resp.model字段才确认我写的 model ID 根本没命中 SolAPI 直接返回了 404 并回退到了默认行为。这篇文章把我踩的两个坑说清楚一个是models里的 model 字段写法变了另一个是tabAutocompleteModel的contextLength上限不一样了。这篇适合谁已经在用 Continue.dev GPT-5.5想升级到 GPT-5.6 Sol 的开发者改完配置发现好像没变化怀疑模型没切成功的人用 OpenAI 兼容 API 接入 Continue.dev 的用户对 Continue.dev 的 config.json 字段规则不太熟想一次搞定的新手整体流程用 Python 脚本验证 API 对 GPT-5.6 Sol 的连通性修改config.json的models块——注意 model ID 写法修改tabAutocompleteModel块——注意 contextLength 上限通过resp.model验证是否真正命中 SolReload Config 生效先说结论配置项GPT-5.5 写法GPT-5.6 Sol 写法填错后果models.modelgpt-5.5gpt-5.6-sol返回 404 报错tabAutocompleteModel.modelgpt-5.5gpt-5.6-sol-complete返回 404 报错tabAutocompleteModel.contextLength最大16384最大32768填超了不报错但截断重点Sol 的 model ID 不是gpt-5.6是gpt-5.6-sol补全模型更不一样是gpt-5.6-sol-complete。写错 model ID 会收到model_not_found的 404 错误不会静默降级。第一步先验证 API 连通性改 config.json 之前先跑一遍 Python 确认你的 API 端点认识gpt-5.6-sol这个 model ID。import openai client openai.OpenAI( api_keyyour-key, base_urlhttps://api.openai.com/v1 # 替换为你实际使用的端点 )resp client.chat.completions.create( modelgpt-5.6-sol, messages[{role: user, content: hi}] ) print(resp.model) # 应输出 gpt-5.6-sol如果resp.model打印出来是gpt-5.6-sol就说明端点已支持。如果报 404 错误说明你的 API 端点还没上线 Sol 模型别急着改 Continue 配置。建议先用下面的方式列出端点支持的模型确认后再操作resp client.models.list() for m in resp.data: if sol in m.id: print(m.id)注意如果你使用第三方聚合网关或代理请先确认该服务商已支持gpt-5.6-sol并使用其提供的base_url。不同服务商的模型上线时间不同建议以各自官方文档为准。第二步修改 models 块对话模型打开配置文件Mac/Linux:~/.continue/config.jsonWindows:%USERPROFILE%\.continue\config.json{ models: [{ provider: openai, model: gpt-5.6-sol, apiKey: YOUR_KEY, apiBase: https://api.openai.com/v1 }] }关键点model字段写gpt-5.6-sol不是gpt-5.6。OpenAI 博客里用的是 GPT-5.6 Sol 这个品牌名但 API 的 model ID 带横杠小写。写成gpt-5.6会直接报 404不会悄悄路由到别的模型。第三步修改 tabAutocompleteModel 块代码补全这里有两个坑叠加坑 1补全模型的 model ID 是gpt-5.6-sol-complete不是gpt-5.6-sol。Sol 把 chat 和 completion 拆成了两个端点5.5 时代是同一个 model ID 通吃的这次不行了。坑 2contextLength 上限从 5.5 的 16384 变成了 32768。如果你之前写死了contextLength: 16384不改也能跑但浪费了 Sol 的长上下文能力。反过来如果你写了超过 32768 的值不报错但会被静默截断到 32768。加上 contextLength 的完整写法tabAutocompleteModel: { provider: openai, model: gpt-5.6-sol-complete, contextLength: 32768, apiKey: YOUR_KEY, apiBase: https://api.openai.com/v1 }第四步验证是否真正命中 Sol保存后在 VS Code 里执行Continue: Reload ConfigMac 下CmdShiftPWindows/Linux 下CtrlShiftP搜索该命令。然后随便问一句话打开 Continue 的输出面板Output → Continue看日志。但日志里不一定显示实际路由到了哪个模型。更直接的方式是用 Python 检查resp.model字段resp client.chat.completions.create( modelgpt-5.6-sol, messages[{role: user, content: test}] ) print(resp.model) # 应输出 gpt-5.6-sol如果返回gpt-5.6-sol就对了。如果报 404说明 model ID 写错了或端点不支持回头检查第一步。说明resp.model是 OpenAI API 响应体中的标准字段反映本次请求实际使用的模型 ID。x-model-id这类响应头是部分第三方代理自行添加的不是 OpenAI 官方 API 的标准字段不建议作为通用验证手段。graph TD A[修改 config.json] -- B[Continue: Reload Config] B -- C{发送测试消息} C -- D[检查 resp.model 字段] D --|gpt-5.6-sol| E[✅ 命中成功] D --|404 报错| F[❌ model ID 有误或端点不支持] F -- G[检查 model 字段拼写] F -- H[检查 API 端点是否已上线 Sol]不同场景怎么选场景一纯对话/代码用途只改models块就够了tabAutocompleteModel可以继续用 5.5 甚至更轻量的模型。Sol 的对话能力提升明显但补全场景对延迟更敏感Sol 的 P95 我测下来在 480ms 左右比 5.5 的 320ms 慢了不少。场景二补全也想用 Sol两个块都改。适合写长文件、需要更多上下文理解的场景比如改一个 2000 行的 legacy 文件。32768 的 contextLength 确实能让补全更准但体感延迟会高一截。场景三团队统一配置如果你们团队十几个人共用 API Key建议用支持调用审计的聚合网关。出了问题能定位到具体是谁的请求在报错——我上个月就是靠后台日志发现有同事还在用旧 model ID。场景四想省钱对话用 Sol 补全用便宜模型models: [{model: gpt-5.6-sol, provider: openai, apiKey: YOUR_KEY}], tabAutocompleteModel: {model: deepseek-chat, provider: openai, apiKey: YOUR_DEEPSEEK_KEY, apiBase: https://api.deepseek.com/v1}Sol 做对话和代码DeepSeek 做实时补全延迟低且便宜。DeepSeek 的 model ID 请以 DeepSeek 官方文档 为准常用的是deepseek-chat。踩坑记录 / 常见问题 FAQQ: 我写了model: gpt-5.6为什么会报错A: OpenAI API 在 model ID 不匹配时会返回model_not_found错误HTTP 404不会静默路由到其他模型。报错信息通常是The model gpt-5.6 does not exist。所以填错 model ID 是有明确错误提示的看到 404 就去检查拼写。Q: 改完 config.json 保存了但没生效A: Continue.dev 不会自动热加载。必须执行Continue: Reload Config命令Mac 下CmdShiftPWindows/Linux 下CtrlShiftP搜索或者直接重启 VS Code。我第一次就是改完直接测以为没生效又改回去了折腾半天。Q: 报错Error: 404 Not Found - The model gpt-5.6 does not exist怎么办A: model ID 写错了或者你的 API 端点还没上线 Sol。正确的 ID 是gpt-5.6-sol对话和gpt-5.6-sol-complete补全。先用 Python 脚本列出端点支持的模型确认一下。Q: contextLength 写多少合适A: Sol 的上限是 32768。写小了浪费能力写大了被截断不报错。建议直接写 32768。如果你用的是补全场景且文件不长写 16384 也行能稍微省点 token 费。Q: 怎么确认我的 API 端点支持 SolA: 跑这段resp client.models.list() for m in resp.data: if sol in m.id: print(m.id)如果输出里有gpt-5.6-sol和gpt-5.6-sol-complete就说明支持。小结GPT-5.6 Sol 接 Continue.dev 本身不难就两个 model ID 和 5.5 不一样。填错 model ID 会直接报 404这反而是好事——至少你知道出问题了不会以为在用新模型其实没有。改完配置后用resp.model验证一下确认命中再继续用。