⚠️ 本文档由 AI 自动翻译。如有任何不准确之处,请参考英文原版。
管理文档
在知识库中,每个导入的项——无论是本地文件、Notion 页面还是网页——都会成为一个文档。你可以在文档列表中查看和管理所有文档,确保知识库的内容始终准确、相关且最新。
| 操作 | 说明 |
|---|---|
| 添加 | 导入新文档。 |
| 修改分段设置 | 修改文档的分段设置(不包括分段结构)。 每个文档可拥有独立的分段设置,但分段结构在整个知识库中共享,且一旦设置无法更改。 |
| 删除 | 永久删除文档。删除不可撤销。 |
| 启用 / 禁用 | 临时将文档纳入或排除检索。 在 Dify Cloud 上,长时间未更新或未被检索的文档会自动禁用以优化性能。 不同订阅计划的未活跃时长如下:
|
| 归档 / 取消归档 | 将不再需要检索但仍需保留的文档归档。归档文档为只读,可随时取消归档。 |
| 编辑 | 通过编辑分段内容修改文档。详见 管理分段。 |
| 重命名 | 修改文档名称。 |
管理分段
根据其分段设置,每个文档被拆分为一个或多个分段,而分段是检索的基本单元。你可以在文档的分段列表中查看和管理所有分段,以提升检索效率与准确性。
| 操作 | 说明 |
|---|---|
| 添加 | 新增或批量新增分段。 对于采用父子分段模式的文档,可同时新增父分段和子分段。 「添加分段」在 Dify Cloud 上为付费功能,升级至 Professional 或 Team 版 即可解锁使用。 |
| 删除 | 永久删除分段。删除不可撤销。 |
| 启用 / 禁用 | 临时将分段纳入或排除检索。已禁用的分段不可编辑。 |
| 编辑 | 修改分段内容。已编辑的分段将标记为 已编辑。 对于采用父子分段模式的文档:
|
| 添加 / 编辑 / 删除关键词 | 在使用经济索引方式的知识库中,可为分段添加或修改关键词,以提升其可检索性。 一个分段最多可添加 10 个关键词。 |
| 添加 / 删除图片附件 | 在对应分段中,删除从文档中提取的图片或上传新图片。 图片附件和分段内容可独立编辑,互不影响。 每个分段最多支持 10 张图片附件,在检索中将被一同返回;超过数量的图片不会被提取。 对于自托管部署,可通过修改环境变量 SINGLE_CHUNK_ATTACHMENT_LIMIT(默认值:10)调整此数量限制。 |
最佳实践
检查分段质量
文档完成分段后,仔细检查每个分段,确保其语义完整、长度适中,以保证检索准确性和回复相关性。 常见问题包括:- 分段 过短:上下文不完整,易造成语义丢失和答案不准确。
- 分段 过长:包含无关信息,易引入语义噪音、降低检索精度。
- 分段 语义不完整:句子或段落被分段设置强制切断,易导致检索结果存在内容缺失或误导。
将子分段用作父分段的检索钩子
对于采用父子分段模式的文档,子分段用于检索,而返回的是父分段。由于编辑子分段不会改变其父分段,可将子分段作为父分段的语义标签或检索提示。 具体做法是将子分段改写为 关键词、摘要 或 常见用户问题。例如,若父分段的内容为退货政策,可将子分段改写为:- 如何退货?
- 退款周期是多少?
- 退货需要支付运费吗?