Opus 4.7 发布一周半,降智又来了。
用过 4.6 的人对这个节奏不会陌生。上一轮从三月初开始,持续了大约六周,有人在 Substack 上写了一整篇文章拆解 4.6 到底怎么变蠢的。Reddit 上”Opus 4.7 is not an upgrade but a serious regression”那个帖子两天内拿了大约 2300 个 upvote。每次新版本都走同一条路——发布,一周内社区分裂,一边说明显进步一边说明显退步。
但有一件事确实变了:回复速度比 4.6 快了不少。
快的原因不是模型推理更高效了——MindStudio 测出来单次 time to first token 其实略慢。快是因为 adaptive thinking 的 router 在很多任务上直接跳过了思考。
我开着 thinking,router 看了一眼文书类的任务,判断不需要深推理,直接端上来一坨没经过思考的输出。速度是快了,质量也掉了。跟我之前写的那个 router 问题是同一个坑——上次是 meta-feedback 场景下 router 不触发 thinking,这次是文书场景。router 对”什么任务值得 think”的判断,到现在还是会在各种场景里翻车。
这个结构性问题我已经说过一遍了,不想再展开。结论还是那个——用户需要一个 per-message 的 thinking toggle,不能全靠 router 猜。
更人性化,但我不喜欢
4.7 在语气上有一个官方承认的 shift。Anthropic 的迁移文档直接写了——more direct, more opinionated, less validation-forward phrasing, fewer emoji。跟 4.6 比起来,4.7 更爱主动表达观点,回答里偶尔嵌入态度和鼓励式的语气。
Anthropic 显然觉得这是改进。从产品角度看可能确实是——让模型更 direct、更有人味,对大多数用户来说体验更好。
但我不是大多数用户。
我用 Claude 的方式是把它当一把手术刀。我说切哪里它就切哪里,不需要它在下刀之前说一句”I understand your concern”。4.6 的冷,对我来说是功能。干净、中性、零情感色彩。你给它一个指令,它精确执行,没有任何多余的人格噪音。
4.7 开始往里加温度了。温度本身没问题,但它默认开着、关不掉。这比降智更让我不舒服,因为降智我可以等它修,人格漂移没有开关可以拉。
每次升级都是这个循环
Claude Code lead engineer Boris Cherny 在 4.7 发布当天说了一句——他自己也花了几天才学会怎么跟 4.7 高效协作。FindSkill 的追踪给了一个总结:higher ceiling, higher migration cost。SWE-bench 从 80.8% 涨到 87.6%,CursorBench 涨了 12 个点,天花板确实高了。但新 tokenizer 最多多吃 35% 的 token,temperature/top_p/top_k 全部 400 error,thinking budget 被拿掉——迁移成本也高。
降智的体感,一部分来自 breaking change 还没消化,一部分来自 router 在特定场景的误判。但有一个更根本的荒谬:Anthropic 按 usage 收费。你付的是 token 的钱。router 替你跳过 thinking,省下来的 token 就是你没花出去的算力——你付了 Opus 级别的价格,router 替你决定你只配拿 low effort 的输出,就好比付着 GPT-5.4 的钱,adaptive thinking 的 router 却替你选了 low effort。
adaptive thinking 的设计意图我理解——让模型自己判断什么时候值得深想,省掉不必要的开销。这个想法没问题。但当你按 token 付费的时候,“帮你省 token”等于”帮你降质”,这两件事在按量计费的模型里是同一件事。用户花了钱想买深推理,router 说你不需要,这算什么?
如果 Anthropic 是订阅制不限量,router 帮你省 token,省的是 Anthropic 的推理成本,用户体验稍微降一点但至少没多花钱,这个 tradeoff 还说得过去。但按 usage 收费的前提下,router 省下来的 token 本来就是用户花钱买的,省不省应该由用户决定。这是 adaptive-only 最大的结构性矛盾——在按量计费的体系里,替用户做预算决策。
我想要的很简单
一个不带情绪的、精确的、不会自作主张往回答里塞态度的 Claude。一个让我自己控制 thinking depth 的开关。4.6 不完美,但它在这两件事上都比 4.7 更接近我要的东西。
降智我可以等它修。router 误判我可以等它调。人格默认值从冷变暖这件事,我没地方改回去。