如何修复你的上下文：优化 LLM Agent 的六大策略

选择性地从外部知识库中检索最相关的信息片段，注入到上下文中，以生成更准确、更丰富的回答。避免将整个文档“灌”给模型。

🎯 核心作用：精准投喂，而非盲目填充。

像游戏前选择装备一样，动态地为当前任务挑选最相关的工具集。过多的工具定义会造成“上下文混淆”，降低模型选择正确工具的能力。

Llama 3.1 8b 性能提升

将复杂任务分解为多个独立的子任务，每个子任务在自己的“隔离”线程中运行，拥有独立、干净的上下文。这避免了交叉污染，并可并行处理，大幅提升效率和质量。

研究系统性能对比

在 Agent 运行过程中，主动评估并移除上下文中已过时、不相关或冗余的信息。如同园丁修剪枝叶，让养分集中在主干上。

95%

Provence 模型可裁剪掉
无关上下文内容

随着对话或任务的进行，将累积的上下文信息提炼成一个简洁的摘要。这既能保留关键记忆，又能有效防止“上下文分心”，让模型保持对核心目标的关注。

🎯 核心作用：保留记忆，减轻负担。

为模型提供一个外部“草稿纸”工具。模型可以将中间思考过程、临时计算或冗长输出记录到这个外部空间，而不是全部堆在主上下文中，从而保持主上下文的清爽和专注。

54%

特定场景下使用 "think" 工具
带来的性能提升

修复你的上下文