技术架构

4.3 长上下文：从“几千 token”到“百万级”

本页主题：**4.3 长上下文：从“几千 token”到“百万级”**。这篇内容会把相关信息按“先理解 → 再操作 →…

导读

本页主题：4.3 长上下文：从“几千 token”到“百万级”。这篇内容会把相关信息按“先理解 → 再操作 → 最后排错/扩展”的顺序组织，帮助你用更短时间建立全局认知，再决定下一步怎么学、怎么用。

覆盖重点：关键机制、性能/质量权衡、多模态链路与工程落地视角。

Gemini 1.5 实验性支持100 万 token 上下文，并在“大海捞针”式检索任务中，在 1000 万 token 范围内仍能保持接近完美的召回率。实际意义：可以一次性上传整份合同、整本书、几小时视频，让模型做全局摘要、跨段推理和细节检索。为后续“智能体长期规划”和“多文档分析”打下基础。