计算机的终极目标是什么?是替代人类思考,还是成为扩展人类思维的工具?本文探讨了 AI 与 IA 的融合,以及它如何重塑我们的创造力。
基于 Shan Carter & Michael Nielsen, Distill (2017)
早期的计算机(如 ENIAC)主要用于批处理复杂的数值计算(如弹道计算)。它们被视为纯粹的计算工具。
Douglas Engelbart 提出愿景:计算机应是实时交互系统,用于支持和扩展人类解决问题的能力。这催生了现代人机交互 (HCI)。
AI 研究通常专注于将智力任务完全外包给机器,目标是在特定任务(如下棋、图像识别)上匹配或超越人类的表现。
长期以来,AI 和 IA 在争夺资源。它们代表了使用技术的两种截然不同的哲学。
目标:认知外包 (Cognitive Outsourcing)
目标:认知转型 (Cognitive Transformation)
今天,一个新的领域正在从 AI 和 IA 的融合中诞生。我们称之为 人工智能增强 (Artificial Intelligence Augmentation, AIA)。
“利用 AI 系统(例如强大的生成模型)来帮助开发智能增强的新方法,从而创造出全新的认知工具和创造性界面。”
AIA 的一个关键应用是“生成式界面”。这就像为复杂的 AI 模型绘制地图,让人类能够探索并利用模型“知道”的知识进行创作。
想象一下,描述一个字体需要数千个像素点(高维数据)。生成模型学习如何将这些复杂数据压缩到少数几个关键变量中(低维数据)。
这个压缩后的空间就是“潜在空间”。在这个空间中移动,就能平滑地改变输出结果。
拖动滑块(模拟改变潜在变量),观察输出(字体)如何变化。
我们可以通过提供范例(例如,几组常规字体和粗体字体)来计算潜在空间中的“属性向量”(例如,“加粗向量”)。
用户提供“常规”和“粗体”的范例。
模型计算两组范例在潜在空间中的差异。
“粗体向量”
将该向量应用到任何新字体上,即可实现加粗。
这种方法的强大之处在于,AI 自动学习了复杂的专家级规则。例如,专业的字体加粗不仅仅是加粗线条,还需要保持字体高度,并智能地保留封闭负空间(如字母 'A' 的内部空隙)以保证易读性。
AIA 将 AI 捕捉到的专家直觉,转化为了人人可用的直观工具。
AIA 的深层价值不在于解决单个问题,而在于改变我们思考的方式本身。
将计算机视为解决问题的“神谕”。“计算机,帮我分类这张图片。”
结果:任务完成了,但人类的思维方式保持不变。
将计算机视为创造新思维原语的元媒介。“这个工具让我能用新的方式思考风格和结构。”
结果:人类内化了新的操作和表征,改变了思维的基底。
我们依赖前人发明的认知技术(如语言、代数、地图)进行思考。AIA 使得快速发明新的认知技术成为可能。
人们常认为界面应该“用户友好”(即简单易用)。但这通常意味着界面是陈词滥调的组合,无法揭示新事物。
真正新颖的表征(如毕加索的画或费曼图)起初看起来很奇怪。最好的界面不追求浅薄的易用性,而是揭示深刻的、令人惊讶的新原则,即使它们最初显得陌生。
AIA 工具非常适合工匠式的创造力——对现有最佳实践进行熟练的重组和应用。
未来强大的生成模型可能会发现超越人类现有知识的抽象概念,帮助我们发现全新的基本原则(类似科学理论预测新现象)。
AIA 提供了一种愿景:AI 帮助我们发明新的认知技术,扩展人类的思维范围,而扩展后的思维又会反过来加速 AI 的发展。
“这不是机器的奇点,而是人类思维范围的奇点。”