跳转到主要内容
⚠️ 本文档由 AI 自动翻译。如有任何不准确之处,请参考英文原版

管理文档

在知识库中,每个导入的项——无论是本地文件、Notion 页面还是网页——都会成为一个文档。你可以在文档列表中查看和管理所有文档,确保知识库的内容始终准确、相关且最新。
点击顶部的知识库名称,可快速切换不同知识库。
管理文档
操作说明
添加导入新文档。
修改分段设置修改文档的分段设置(不包括分段结构)。
每个文档可拥有独立的分段设置,但分段结构在整个知识库中共享,且一旦设置无法更改。
删除永久删除文档。删除不可撤销
启用 / 禁用临时将文档纳入或排除检索。
在 Dify Cloud 上,长时间未更新或未被检索的文档会自动禁用以优化性能。

不同订阅计划的未活跃时长如下:
  • Sandbox:7 天
  • Professional & Team:30 天
Professional 和 Team 用户可一键重新启用这些文档。
归档 / 取消归档将不再需要检索但仍需保留的文档归档。归档文档为只读,可随时取消归档。
编辑通过编辑分段内容修改文档。详见 管理分段
重命名修改文档名称。

管理分段

根据其分段设置,每个文档被拆分为一个或多个分段,而分段是检索的基本单元。你可以在文档的分段列表中查看和管理所有分段,以提升检索效率与准确性。
点击左上角的文档名称,可快速切换不同文档。
管理分段
操作说明
添加新增或批量新增分段。

对于采用父子分段模式的文档,可同时新增父分段和子分段。
「添加分段」在 Dify Cloud 上为付费功能,升级至 Professional 或 Team 版 即可解锁使用。
删除永久删除分段。删除不可撤销
启用 / 禁用临时将分段纳入或排除检索。已禁用的分段不可编辑。
编辑修改分段内容。已编辑的分段将标记为 已编辑

对于采用父子分段模式的文档:
  • 编辑父分段时,可选择重新生成其子分段或保持原有的子分段不变。
  • 编辑子分段不会改变其父分段。
当文档中的图片被提取为分段附件时,其 URL 会保留在分段文本中。删除 URL 不会影响已提取的图片附件。
添加 / 编辑 / 删除关键词在使用经济索引方式的知识库中,可为分段添加或修改关键词,以提升其可检索性。

一个分段最多可添加 10 个关键词。
添加 / 删除图片附件在对应分段中,删除从文档中提取的图片或上传新图片。

图片附件和分段内容可独立编辑,互不影响。
每个分段最多支持 10 张图片附件,在检索中将被一同返回;超过数量的图片不会被提取。

对于自托管部署,可通过修改环境变量 SINGLE_CHUNK_ATTACHMENT_LIMIT(默认值:10)调整此数量限制。
若要启用跨模态检索——即基于语义相关性同时检索文本和图片,需为知识库选择多模态嵌入模型(带有 Vision 图标)。被提取的图片附件将被向量化并参与检索。

最佳实践

检查分段质量

文档完成分段后,仔细检查每个分段,确保其语义完整、长度适中,以保证检索准确性和回复相关性。 常见问题包括:
  • 分段 过短:上下文不完整,易造成语义丢失和答案不准确。
  • 分段 过长:包含无关信息,易引入语义噪音、降低检索精度。
  • 分段 语义不完整:句子或段落被分段设置强制切断,易导致检索结果存在内容缺失或误导。

将子分段用作父分段的检索钩子

对于采用父子分段模式的文档,子分段用于检索,而返回的是父分段。由于编辑子分段不会改变其父分段,可将子分段作为父分段的语义标签或检索提示。 具体做法是将子分段改写为 关键词摘要常见用户问题。例如,若父分段的内容为退货政策,可将子分段改写为:
  • 如何退货?
  • 退款周期是多少?
  • 退货需要支付运费吗?