跳转到主要内容
⚠️ 本文档由 AI 自动翻译。如有任何不准确之处,请参考英文原版
知识库创建后,其数据源无法更改。
快速创建知识库时,可上传本地文件作为其数据源:
  1. 点击 知识库 > 创建知识库
  2. 选择 导入已有文本 作为数据源,然后上传文件。
    • 单次最多可上传 5 个文件
      在 Dify Cloud 上,仅付费套餐支持批量上传(单次最多 50 个文件)。
    • 单个文件最大支持 15 MB
    对于自托管部署,可通过环境变量 UPLOAD_FILE_SIZE_LIMITUPLOAD_FILE_BATCH_LIMIT 调整这两个限制。

对于文件中的图片 JPG、JPEG、PNG 和 GIF 格式且小于 2 MB 的图片将作为附件,自动提取到对应的分段。这些图片可独立管理,并在检索时与分段一同返回。 提取的图片 URL 会保留在分段文本中,但你可以放心删除这些 URL 以保持文本整洁——这不会影响已提取的图片。 若在索引设置中选择多模态嵌入模型(带有 Vision 图标),则提取出的图片也将被向量化并索引以供检索。 每个分段最多支持 10 个图片附件,超出的图片不会被提取。
对于自托管部署,可通过环境变量调整以下限制:
  • 最大图片尺寸:ATTACHMENT_IMAGE_FILE_SIZE_LIMIT
  • 每个分段的最大附件数量:SINGLE_CHUNK_ATTACHMENT_LIMIT
以上提取规则适用于如下图片类型:
  • DOCX 文件中嵌入的图片
    其他文件类型(如 PDF)中嵌入的图片,可通过在知识流水线中使用合适的文档提取插件进行提取。
  • 在任何文件类型中,通过以下 Markdown 语法引用、URL 可访问的图片:
    • ![alt text](image_url)
    • ![alt text](image_url "optional title")