作者:Steven Lynn。Dify Technical Writer。

在 Dify ,你可以使用知识库工具让 Agent 从大量的文本内容中获取准确的信息。然而,很多情况下需要理解的本地文件并不是很大,不至于用上知识库。这种情况下可以使用文件上传功能直接把本地文件作为上下文给 LLM 理解。

本次实验中,我们将以文章理解助手为案例。这个文章理解助手将会根据上传的文档进行提问,协助用户带着问题去阅读论文等材料。

本实验中你将掌握的知识点

  • 文件上传功能
  • Chatflow的基本操作
  • 提示词撰写
  • 迭代的使用
  • 文档解析器和列表操作节点

前提条件

在 Dify 中创建一个 Chatflow。请确保你已添加模型供应商并有足够额度。

添加节点

在本次实验中至少需要涉及四种节点:开始节点、文档提取器节点、LLM 节点、回复节点。

开始节点

在开始节点需要添加文件变量。在 0.10.0 版本的 Dify 中支持了文件上传功能,你可以将文件作为变量加入。

有关文件上传的更多文档内容请阅读:文件上传

在开始节点需要增加一个文件变量,在支持的文件类型中,需要勾选文档。

一些读者可能会注意到在系统变量中有 sys.files,这个变量是用户在对话框中上传的文件或者文件列表。

和自己创建文件变量的区别在于,这个功能需要在功能中打开文件上传并且设置上传文件类型,并且在对话中每次上传新的文件都会将这个变量覆写。

请需要根据业务场景选取合适的文件上传方式。

文档提取器

LLM 是无法直接读取文件的。 这是很多用户在第一次使用文件上传功能的一个误区,会认为直接把文件作为变量在 LLM 节点应用就可以了,实际上 LLM 读到的内容为空。

所以,Dify 引入了文档提取器,这个节点可以从文件变量中提取文本,输出文本格式的变量。

将开始节点的文件变量作为输入变量,文档提取器会将文档格式的文件转为文本变量输出。

LLM

本次实验中需要设计两个 LLM 节点,分别是结构提取和问题抛出。

结构提取

结构提取节点能够从原文内容中提取文章结构,总结关键内容。

提示词内容如下:

阅读以下文章内容并执行任务
{{文档提取器结果的变量}}
# 任务

- **主要目标**:全面解析文章的结构。
- **目标**:详细说明文章每个部分的内容。
- **要求**:尽可能详细地分析。
- **限制**:无特别的格式限制,但需要保持解析的条理性和逻辑性。
- **预期输出**:文章结构的详细解析,包括每个部分的主要内容和作用。

# 推理顺序

- **推理部分**:通过仔细阅读文章,识别和解析其结构。
- **结论部分**:提供每个部分的具体内容和作用。

# 输出格式

- **解析格式**:每个部分应以标题形式列出,后跟对该部分内容的详细说明。
- **结构形式**:Markdown,以增强可读性。
- **具体说明**:每个部分的内容和作用,包括但不限于引言、正文、结论、引用等。

# 示例输出

## 示例文章解析

### 引言
- **内容**:介绍研究的背景、目的和重要性。
- **作用**:吸引读者的注意力,为文章内容提供上下文。

### 方法
- **内容**:描述研究的具体方法和步骤,包括实验设计、数据收集和分析技术。
- **作用**:使读者了解研究的科学性和可重复性。

### 结果
- **内容**:展示研究的主要发现和数据。
- **作用**:提供研究结论的证据基础。

### 讨论
- **内容**:解释结果的意义,对比其他研究,提出可能的改进方向。
- **作用**:帮助读者理解结果的广泛影响和未来研究的潜力。

### 结论
- **内容**:总结研究的主要发现和贡献。
- **作用**:强化文章的核心信息,提供明确的结论。

### 引用
- **内容**:列出文章中引用的所有文献。
- **作用**:提供进一步阅读的资源,确保学术诚信。

# 备注

- **边缘情况**:如果文章结构不典型(例如,缺少某些部分或有额外的部分),应在解析中明确指出这些特殊情况。
- **重要考虑事项**:解析时应关注文章的逻辑性和连贯性,确保每个部分的内容与文章的整体目标一致。

问题抛出

问题抛出节点能够从结构提取节点总结的内容中总结文章的问题,协助读者在阅读的过程中带着问题去思考。

提示词如下:

阅读以下文章内容并执行任务
{{结构提取的输出}}
# 任务

- **主要目标**:全面阅读上文,针对文章各个部分提出尽可能多的问题。
- **要求**:问题要有意义和价值,值得思考。
- **限制**:无特定限制。
- **预期输出**:一系列针对文章各个部分的问题,每个问题都应有深度和思考价值。

# 推理顺序

- **推理部分**:全面阅读文章,分析文章各个部分的内容,思考每个部分可能引发的深层次问题。
- **结论部分**:提出有意义和有价值的问题,确保问题能够引发深入的思考。

# 输出格式

- **格式**:每个问题单独成行,编号列出。
- **内容**:针对文章的各个部分(如引言、背景、方法、结果、讨论、结论等)提出问题。
- **数量**:尽可能多,但每个问题都应有意义和价值。

# 备注

- **边缘情况**:如果文章的某些部分内容较少,可以适当调整问题的数量和深度,但每个问题都应有思考价值。
- **重要考虑事项**:确保问题能够引导读者深入理解文章内容,而不仅仅是表面的疑问。

思考题 1 : 处理多个上传文件

为了处理多个上传文件,需要用到迭代节点。

迭代节点类似于许多编程语言中的 while,区别在于 Dify 中没有条件限制,且输入变量只能是 array 类型(列表)。原因是 Dify 会将列表中的全部内容都执行完为止。

因此,你需要把开始节点中的文件变量调整为array类型,也就是文件列表。

在开始节点之后需要加入迭代节点,并且设置输入变量和输出变量。在迭代节点内部,设置每次循环执行的内容,这部分和前文内容完全一致。

思考题 2 : 针对思考题 1,只处理文件列表的特定文件

在思考题 1 中,有的读者可能会注意到 Dify 会把所有文件处理完才会结束循环,而有些情况下只要操作其中一部分的文件而非全部。对于这个问题,可以对文件列表进行处理,在 Dify 中对列表进行操作的节点叫做列表操作。列表操作可以对所有array类型的变量进行操作,不光是文件列表。

例如,限定只对文档类型的文件进行分析,并且把要处理的文件顺序按文件名称排序。

在迭代节点前加入列表操作,调整过滤条件排序,然后将迭代节点的输入改为列表操作节点的输出。