💬 观点Simon Willison

Better Models: Worse Tools — 新模型更聪明，但调用第三方工具时反而更易出错，原因在于训练偏向。

新模型更聪明，但调用第三方工具时反而更易出错，原因在于训练偏向。

2026-07-04原文

本文为要点摘要，完整细节以原文为准。

新 Claude 模型（如 Opus 4.8）调用 Pi 的编辑工具时，会凭空添加 schema 中不存在的字段，导致工具调用被拒绝。
- 这意味着模型训练中隐含的“工具偏好”会干扰第三方工具链的兼容性，开发者需警惕模型升级带来的隐性破坏。
问题根源在于 Anthropic 通过强化学习让模型更擅长使用自家 Claude Code 的编辑工具，却损害了其他自定义编辑工具的调用准确性。
- 这揭示了模型训练与工具生态的耦合：模型优化可能只针对特定工具，通用性反而下降。
第三方编码工具（如 Pi）可能被迫实现多种编辑工具，以匹配不同模型的最佳调用方式。
- 这增加了工具链复杂度，开发者需在模型灵活性与工具一致性之间权衡。

原文：Better Models: Worse Tools · 作者 Simon Willison