AI Agent 的现状

吴恩达 (Andrew Ng) 在 LangChain Interrupt 大会的深度洞察

视频来源 ↗
🏷️ 分类: 人工智能 商业
🔖 标签: #AI Agent #LangChain #吴恩达 #自主性 #语音栈 #编程技能

核心观念转变:从“是不是 Agent”到“多大程度 Agentic”

吴恩达建议,与其争论一个系统是否为“真正的 Agent”,不如将其视为一个“智能体化 (Agentic)”的连续光谱。

低自主性

(简单脚本)

中度自主性

(RAG, 工具调用)

高自主性

(复杂规划, 多步推理)

💡 这个视角减少了社区内耗,让开发者专注于构建不同自主程度的实用系统。

Agent 应用现状:价值分布在哪里?

商业机会分布

企业面临的核心挑战

  • 流程分解:如何将现有业务流程,转化为 Agent 能理解和执行的微任务?
  • 性能调优:当原型效果不佳时,如何定位并改进有问题的步骤或提示?
  • 稀缺技能:兼具业务理解、流程拆解和评估体系搭建能力的人才凤毛麟角。

Agent 构建者必备的核心技能

📊

系统化评估 (Evals)

这是最被低估但至关重要的技能。许多团队过久地依赖“人眼评估”。

  • ✓ 快速启动: 别等完美,用20分钟写个“够用”的评估脚本。
  • ✓ 迭代优化: 从一个不完美的评估开始,逐步完善它。
  • ✓ 辅助而非替代: 自动化评估用于捕捉回归问题,减轻心智负担。
🧠

“手感”知识与直觉

源于实践的宝贵经验,能判断何时深入、何时放弃。

  • ✓ 快速决策: 迅速判断一个技术路径是否可行。
  • ✓ 洞察局限: 深刻理解 LLM 的能力边界和产品框架。
  • ✓ 善用工具: 借助 LangSmith 等工具的追踪信息来辅助决策。
🧱

乐高积木式思维

将各种AI技术和模式视为不同颜色的乐高积木。

  • ✓ 丰富工具箱: 掌握 RAG、Evals、Memory、Guardrails 等多种“积木”。
  • ✓ 快速组装: 熟练组合不同工具,快速搭建复杂应用。
  • ✓ 知识更新: 保持学习,因为“积木”本身(如LLM)在不断进化。

被低估的新兴领域与趋势

🎙️ 语音栈 (Voice Stack)

巨大潜力

大量企业对此兴趣浓厚,但开发者关注度相对不足。

核心优势:降低用户输入摩擦,比文本框更自然、更少心理压力。

主要挑战:延迟。理想响应时间 < 1秒。

巧妙对策:用“嗯,让我想想...”等预响应或背景音来掩盖延迟。

💻 普及编程技能

颠覆认知

“AI会取代编程,无需学习”是“史上最差的职业建议之一”。

历史规律:编程越简单,就有越多人编程。

未来核心能力:精确地告诉计算机你想让它做什么。

实践案例:AI Fund 全员(包括CFO和前台)都学习编程以提升生产力。

协议与标准的现状

🔌 MCP (Managed Component Protocol)

前景光明,但处于“西部拓荒”阶段

旨在标准化工具和数据源接口,解决“数据管道”难题,将 N*M 的集成工作降为 N+M。

当前问题:实现质量参差不齐,认证系统笨重,协议本身待完善(如需要层级发现机制)。

🤖↔️🤖 Agent 间通信

“为时尚早”,仍是“双重奇迹”

让自己的 Agent 工作已是挑战,让它与别人的 Agent 协作更是难上加难。

可行场景:单一团队内部构建的多 Agent 系统。跨团队的 Agent 协作成功案例目前罕见。

🚀 对 AI 创业者的核心建议

⚡️

速度 (Speed)

是创业成功的第一预测指标。顶尖团队的执行速度远超想象。

💡

技术知识

是第二预测指标,也是最稀缺的资源,因为它在飞速进化。