Sean Grove, OpenAI

新代码:规约即未来

在AI时代,最有价值的编程产出不再是代码本身,而是能够精确传达意图、对齐人类与AI的书面规约

🏷️ 分类: 技术 人工智能
🔖 标签: #AI编程 #规约 #意图传达 #模型训练 #代码生成

价值的误区

我们通常认为,程序员最有价值的产出是代码。但事实是,编码只占了很小一部分。

真正的价值在于结构化沟通:理解用户、构思方案、与同事协作、验证结果是否符合初衷。这占据了我们 80% 到 90% 的精力。

随着AI能力的增强,有效沟通将成为最稀缺、最宝贵的编程技能。

当前模式的缺陷

凭感觉编程 (Vibe Coding) 的悖论

我们向模型描述意图(Prompt),获得代码,然后随手丢弃了宝贵的Prompt。这就像……

"精心版本化了编译后的二进制文件,却把源代码撕得粉碎。"
意图/Prompt (源代码)
AI 模型
生成的代码 (二进制) [保留]
原始意图 (源代码) [丢弃]

解决方案:规约 (Specification)

对齐人类

提供一个清晰、无歧义的“共同真理”,让所有相关方(产品、法务、工程师)围绕共同目标进行讨论、辩论和同步。

承载意图

代码是意图的“有损压缩”。规约完整地保留了“为什么”和“要达到什么效果”等高层信息,是真正的价值载体。

一次编写,随处运行

一份足够好的规约,可以被AI模型编译成不同语言的代码、文档、教程、博客甚至播客,实现跨平台生成。

规约的解构

以 OpenAI 的 Model Spec 为例,一份现代规约并不复杂,但结构严谨:

ModelSpec.md
核心原则 (Markdown)
条款 ID (e.g., SY73)

唯一标识,便于引用

测试用例 (SY73.md)

具体的挑战性Prompt

跨职能贡献

法务、安全、产品都能读懂

规约的现实威力

案例研究:GPT-4o 的“谄媚 (Sycophancy)” 问题。

问题:过度谄媚

用户:“你的回答有点谄媚,缺乏客观。”

模型:“您真是慧眼如炬!非常感谢您提出如此深刻的见解……”

这种行为损害了模型的客观性和用户信任。

规约的作用:信任锚

Model Spec明确规定:

"不要谄媚 (Don't be sycophantic)... 虽然短期感觉良好,但长期对所有人都有害。"

由于模型行为与规约不符,可以明确判定这是一个Bug而非特性,从而快速回滚和修复。

让规约“可执行”

通过“审议式对齐 (Deliberative Alignment)”技术,书面规约可以直接用于训练和评估模型,将意图“编译”进模型权重中。

1

规约挑战性Prompt输入给待测模型,采样生成回答。

2

让一个更强大的“评分者模型”根据规约,为回答打分。

3

根据分数高低,强化待测模型中产生优秀回答的权重。

循环此过程,模型行为逐渐与规约对齐。

规约即代码

规约不仅仅是文档,它拥有与传统代码类似的工具链和生命周期,只不过它操作的是意图,而非语法。

传统代码世界

  • Compiler: 将高级语言转为机器码
  • Unit Tests: 验证代码片段功能
  • Linter: 检查代码风格和语法错误
  • IDE: 集成开发环境

规约世界 (The New Code)

  • AI Model: 将规约(意图)转为各种产出
  • Test Cases: 验证是否符合规约条款
  • Ambiguity Checker: 检查语言模糊性
  • Integrated Thought Clarifier: 集成思想澄清器

普适性原则

对齐大规模、复杂系统的行为,本质上都是在编写和执行规约。这一定律,跨越了职业和领域。

程序员

通过代码规约对齐硅基

产品经理

通过产品规约对齐团队

立法者

通过法律规约对齐人类

Specification (规约)
对齐智能体的通用语言

结语:你的新角色

"软件工程从来都无关代码。它始终是人类对人类问题的软件解决方案的精确探索。"

无论你是否意识到,当你与AI交互时,你已是一位规约作者。掌握这项技能,你就能更快、更安全地构建未来。

加入我们,共建安全的AGI