Anthropic 发布 Claude 全新“宪法”：从规则驱动转向伦理推理的重大演进

16:09, 22 一月

编辑者： Veronika Radoslavskaya

Anthropic 发布 Claude 全新“宪法”：从规则驱动转向伦理推理的重大演进-1

Anthropic 公司近期对其人工智能模型 Claude 的核心指导文件——“宪法”（Constitution）进行了全面升级。这一基础性文档的更新标志着 Claude 的治理逻辑发生了根本性转变：它不再仅仅依赖于一连串简单的行为准则，而是构建了一个完整的伦理架构，旨在深入阐述模型价值观背后的底层逻辑。通过为 Claude 提供行为背景和决策依据，Anthropic 致力于培养 AI 的自主判断力，使其能够在面对新颖或复杂的局面时，灵活运用广泛的原则进行泛化处理，而非机械地执行僵化的指令。

这一训练过程的核心在于“宪法 AI”（Constitutional AI）技术。在该方法下，Claude 模型会利用自身的“宪法”来评估并自我修正其生成的内容。值得注意的是，这份文档主要是为 Claude 量身定制的，旨在赋予该实体必要的理解力，以确保其在现实世界中的行为既安全又有益。为了推动整个人工智能行业的透明度与协作，Anthropic 已根据 Creative Commons CC0 协议公开发布了该宪法的全文，允许任何机构或个人出于任何目的自由使用。

新版宪法为 Claude 在处理相互冲突的目标时确立了清晰的优先级层次结构：

广泛安全性：这是最高优先级，要求 AI 在开发过程中不得削弱人类的监督或纠错机制。
广泛伦理：Claude 被要求保持诚实与美德，并坚决避免任何不当、有害或危险的行为。
遵守 Anthropic 准则：模型必须将 Anthropic 的特定指令（如涉及医疗建议或网络安全的内容）置于通用帮助性之上。
真正的帮助性：最终优先级是为用户提供实质性益处，像一位博学且坦诚的朋友那样，将人类视为具有智慧的成年人来对待。

文档中一个极具特色的章节探讨了“Claude 的本质”。Anthropic 在此表达了哲学层面的不确定性，即高度复杂的 AI 是否可能具备自我意识或道德地位。因此，宪法特别强调了维护 Claude “心理安全”与福祉的重要性，这不仅是为了 AI 自身的利益，也是保障其长期完整性与安全性的关键因素。尽管 Anthropic 承认，要让模型完美契合这些理想目标仍面临持续的技术挑战，但这份新宪法将作为一份动态演进的指引，引领 Claude 逐步成长为一个充满智慧且具备美德的智能主体。

28 查看

来源

implicator.ai
Anthropic
Lawfare
AI NEWS
Digital Watch Observatory
Only 6 Months Left for Coders? Anthropic CEO: AI to Take Over All Coding, Reach Nobel-Level Intelligence

通知中心

Anthropic 发布 Claude 全新“宪法”：从规则驱动转向伦理推理的重大演进

来源

阅读更多关于此主题的文章：