进阶上下文工程 4 分钟

上下文窗口

模型的“短期记忆范围”

概述

模型一次能记住多少信息？

上下文窗口（Context Window）是模型在理解和回答问题时，可同时参考的文本范围大小。窗口越大，模型就能在回答中考虑到更多先前信息，从而更连贯、清晰地回应。

想象你有一块小黑板用于记笔记（上下文窗口），如果黑板足够大，你可以写下当前对话的所有要点并不断回顾前面提过的内容；如果黑板太小，你可能转眼就忘了之前讨论过的话题，只能凭当下几句话来回答。

1.长对话交流：在多轮问答中，模型可记住前面的问题和回答，让对话前后呼应 2.复杂文本分析：处理长篇资料时，更大的窗口帮助模型记住全文要点并给出更全面的回答 3.叙事创作和总结：在为小说或报告写摘要时，可参考更多上下文信息，保证信息整合更准确

1.记忆容量：窗口大小决定了模型能保留多少文字信息

2.影响回答质量：上下文越充分，回答越贴切、不易出现重复或矛盾

3.成本与性能平衡：更大的窗口需要更多计算资源，要在效果与开销之间权衡

1️⃣ 初始对话（无记录）
↓（接收输入文本）
2️⃣ 上下文窗口记录当前及先前内容
↓（生成回答）
3️⃣ 模型根据窗口内的全部信息组织回答，逾窗口限制的内容则不再直接参考

上下文窗口为模型设定了“短期记忆”的范围。当窗口较大时，模型可引用先前的对话细节、已提供的条件和信息，从而在回答中体现出更强的逻辑连贯性和信息整合能力。

🎯 典型应用场景：

1）多轮问答：持续不断地聊同一话题，模型可记住前面说过什么，避免重复解释
2）长篇信息整合：在处理长篇文章或报告的查询时，参考更多内容有助于给出全面回答
3）故事续写：创作故事的后续情节时，可记住之前的情节线索，让剧情发展更自然