Anthropic 发布 80 页《Claude 宪法》,确立 AI 伦理运行框架

Anthropic CEO Dario Amodei 在达沃斯世界经济论坛上发布修订后的《Claude 宪法》,全文约 80 页,系统阐述 Claude 的运行原则,被视为 Anthropic 在 AI 伦理治理上的核心文件。

该宪法基于 Anthropic 的“宪法式 AI”方法,通过模型自我约束而非主要依赖人工反馈,降低有害内容生成风险。新版准则将 Claude 的行为规范归纳为四个维度:总体安全、广泛道德感、合规约束与真诚帮助。