学习如何部署本地文档 MCP 服务器,并通过 AI 与文档进行对话。
工作原理
特性 | RAG (检索增强生成) | MCP (Model Context Protocol) |
---|---|---|
工作原理 | 预先将文档分割成文本块,使用向量嵌入建立索引。用户提问时,系统计算问题与文本块相似度,选择相关块作为上下文生成答案。 | AI 根据问题需求主动生成查询策略,支持多轮交互查询,根据初次结果调整后续搜索。 |
优势 | 处理速度快,适合大规模静态文档集合。 | - 可访问完整文档内容,支持跨章节复杂查询 - 文档更新后无需再次进行繁琐处理,重新生成 MCP 服务即可提供查询服务 - 提供连贯完整的答案 |
局限性 | - 静态文档分割可能分散相关信息 - 基于向量相似度检索可能遗漏语义相关但词汇不同的内容 - 上下文窗口限制,仅基于特定片段生成答案 | - 需要消耗大量 Tokens,成本较高 - 依赖 LLM 的查询策略生成能力,可能影响检索准确性 - 多轮交互查询可能导致响应时间较长 - 需要额外的 MCP 服务器部署和维护成本 |