💬 观点Simon Willison
Better Models: Worse Tools — 新模型更聪明,但调用第三方工具时反而更易出错,原因在于训练偏向。
新模型更聪明,但调用第三方工具时反而更易出错,原因在于训练偏向。
2026-07-04原文
本文为要点摘要,完整细节以原文为准。
-
新 Claude 模型(如 Opus 4.8)调用 Pi 的编辑工具时,会凭空添加 schema 中不存在的字段,导致工具调用被拒绝。
- 这意味着模型训练中隐含的“工具偏好”会干扰第三方工具链的兼容性,开发者需警惕模型升级带来的隐性破坏。
-
问题根源在于 Anthropic 通过强化学习让模型更擅长使用自家 Claude Code 的编辑工具,却损害了其他自定义编辑工具的调用准确性。
- 这揭示了模型训练与工具生态的耦合:模型优化可能只针对特定工具,通用性反而下降。
-
第三方编码工具(如 Pi)可能被迫实现多种编辑工具,以匹配不同模型的最佳调用方式。
- 这增加了工具链复杂度,开发者需在模型灵活性与工具一致性之间权衡。
原文:Better Models: Worse Tools · 作者 Simon Willison