语义检索指的是比对用户问题与知识库内容中的向量距离。距离越近,匹配的概率越大。参考阅读:《Dify:Embedding 技术与 Dify 数据集设计/规划》。
在模型供应商内配置 Rerank 模型
启用自动模式后,你依然需要在 模型 栏中选择合适的大模型以执行文档检索任务。
如果你同时选择了多个知识库,下拉列表只会显示这些知识库共有的元数据字段。
字段类型 | 筛选条件 | 筛选条件说明与示例 |
---|---|---|
字符串 | is | 字段的值必须与你输入的值完全匹配。例如,如果你设置筛选条件为 is "Published" ,则只会返回标记为 “Published” 的文档。 |
is not | 字段的值不能与你输入的值匹配。例如,如果你设置筛选条件为 is not "Draft" ,则会返回所有未标记为 “Draft” 的文档。 | |
is empty | 字段的值为空。如果你配置了此条件,可以检索到未标记该字符串的文档。 | |
is not empty | 字段的值不为空。如果你配置了此条件,可以检索到标记了该字符串的文档。 | |
contains | 字段的值包含你输入的文本。例如,如果你设置筛选条件为 contains "Report" ,则会返回所有包含”Report”的文档,如”Monthly Report” 或 “Annual Report”。 | |
not contains | 字段的值不包含你输入的文本。例如,如果你设置筛选条件为 not contains "Draft" ,则会返回所有不包含 “Draft” 的文档。 | |
starts with | 字段的值以你输入的文本开头。例如,如果你设置筛选条件为 starts with "Doc" ,则会返回所有以”Doc”开头的文档,如 “Doc1”、“Document”等。 | |
ends with | 字段的值以你输入的文本结尾。例如,如果你设置筛选条件为 ends with "2024" ,则会返回所有以”2024”结尾的文档,如”Report 2024”、“Summary 2024”等。 | |
数字 | = | 字段的值必须等于你输入的数字。例如,= 10 会匹配所有数字标记为 10 的文档。 |
≠ | 字段的值不能等于你输入的数字。例如,≠ 5 会返回所有数字未标记为 5 的文档。 | |
> | 字段的值必须大于你输入的数字。例如,100 会返回所有数字标记为大于 100 的文档。 | |
< | 字段的值必须小于你输入的数字。例如,< 50 会返回所有数字标记为小于 50 的文档。 | |
≥ | 字段的值必须大于或等于你输入的数字。例如,≥ 20 会返回所有数字标记为大于或等于 20 的文档。 | |
≤ | 字段的值必须小于或等于你输入的数字。例如,≤ 200 会返回所有数字标记为小于或等于 200 的文档。 | |
is empty | 字段未设置值。例如,is empty 会返回所有该字段未标记数字的文档。 | |
is not empty | 字段已设置值。例如,is not empty 会返回所有该字段已标记数字的文档。 | |
时间 | is | 字段的时间值必须与你选择的时间完全匹配。例如,is "2024-01-01" 只会返回标记为 2024 年 1 月 1 日的文档。 |
before | 字段的时间值必须早于你选择的时间。例如,before "2024-01-01" 会返回所有标记为 2024 年 1 月 1 日之前的文档。 | |
after | 字段的时间值必须晚于你选择的时间。例如,after "2024-01-01" 会返回所有标记为 2024 年 1 月 1 日之后的文档。 | |
is empty | 字段的时间值为空。如果你配置了此条件,可以检索到未标记该时间信息的文档。 | |
is not empty | 字段的时间值不为空。如果你配置了此条件,可以检索到标记了该时间信息的文档。 |
时间 字段类型仅支持使用常量筛选文档。如果你选用时间字段筛选文档,系统会弹出时间选择器,供你选择具体的时间节点。
starts with "App"
或 contains "App"
时,系统会返回标记为 “Apple” 的文档,但不会返回标记为 “apple” 或 “APPLE” 的文档。AND
或 OR
。
AND
:当一个文档满足所有筛选条件时,才能检索到该文档。OR
:只要一个文档满足其中任意一个筛选条件,就可以检索到该文档。