💬 观点Anthropic

Widening the conversation on frontier AI — Anthropic 如何通过与多元智慧传统对话，塑造 Claude 的道德品格与

Anthropic 如何通过与多元智慧传统对话，塑造 Claude 的道德品格与价值观。

2026-06-08原文

本文为要点摘要，完整细节以原文为准。

Anthropic 近期启动了一项与多元智慧传统（包括宗教、哲学、文化等领域的学者和实践者）的对话计划，旨在为前沿 AI 系统的道德塑造汲取广泛的人类智慧。

从人类智慧传统中学习道德塑造：Anthropic 认为，构建安全有益的 AI 不仅需要技术对齐，还需思考“何为良善的 AI 品格”。他们主动向长期研究美德、品格与美好生活的宗教、哲学等传统寻求见解。
- 对开发者的含义：AI 的道德设计需要超越纯技术范畴，主动纳入人文与社会领域的深厚思想资源。
实验外部“道德提醒”工具：受人类道德发展中“导师”角色的启发，团队尝试为 Claude 内置一个可调用的工具，在关键决策前提醒其自身的伦理承诺。初步实验显示，这显著降低了未对齐行为的发生率。
- 对工具链的含义：在 AI 决策循环中嵌入结构化的伦理反思机制，可能成为提升模型安全性与稳健性的有效工程路径。
规划更广泛的跨领域对话：Anthropic 计划将对话扩展至法律学者、心理学家、作家及公民机构等群体，探讨 AI 如何重塑工作、制度与权力分配等更广阔的社会议题。
- 对 Agent 的含义：未来 Agent 的价值观与行为准则，可能需要建立在持续、多元的社会对话与技术迭代相结合的基础之上。

原文：Widening the conversation on frontier AI · 作者 Anthropic

💬 观点Anthropic

Anthropic 如何通过与多元智慧传统对话，塑造 Claude 的道德品格与价值观。

2026-06-08原文

本文为要点摘要，完整细节以原文为准。

从人类智慧传统中学习道德塑造：Anthropic 认为，构建安全有益的 AI 不仅需要技术对齐，还需思考“何为良善的 AI 品格”。他们主动向长期研究美德、品格与美好生活的宗教、哲学等传统寻求见解。
- 对开发者的含义：AI 的道德设计需要超越纯技术范畴，主动纳入人文与社会领域的深厚思想资源。
实验外部“道德提醒”工具：受人类道德发展中“导师”角色的启发，团队尝试为 Claude 内置一个可调用的工具，在关键决策前提醒其自身的伦理承诺。初步实验显示，这显著降低了未对齐行为的发生率。
- 对工具链的含义：在 AI 决策循环中嵌入结构化的伦理反思机制，可能成为提升模型安全性与稳健性的有效工程路径。
规划更广泛的跨领域对话：Anthropic 计划将对话扩展至法律学者、心理学家、作家及公民机构等群体，探讨 AI 如何重塑工作、制度与权力分配等更广阔的社会议题。
- 对 Agent 的含义：未来 Agent 的价值观与行为准则，可能需要建立在持续、多元的社会对话与技术迭代相结合的基础之上。

原文：Widening the conversation on frontier AI · 作者 Anthropic