メインコンテンツへスキップ
ナレッジベースパイプラインの作成 画面上部のナレッジベースをクリックし、左メニューからナレッジベースパイプラインから作成を選択します。開始方法は以下の3通りです。

1. ゼロから作成する

ゼロから構築 空白のナレッジベースパイプラインをクリックすると、カスタムパイプラインを一から構築できます。特定のデータソースやビジネス要件に合わせた処理戦略が必要な場合に選択します。

2. テンプレートから作成する

Difyは2種類のテンプレートを提供しています:内部パイプラインカスタマイズ済み。どちらもカード上にナレッジベース名、説明、タグ(チャンキング構造など)が表示されます。

内部パイプライン(Built-in Pipeline)

内部パイプラインはDify公式があらかじめ用意したナレッジベーステンプレートで、一般的なドキュメント構造やユースケースに最適化されています。使用したいテンプレートの「選択」をクリックするだけで導入できます。 内部テンプレート テンプレートの種類
テンプレート名チャンキング構造インデックス方式検索設定説明
汎用分割モード
(General Mode)
汎用モード省リソース逆インデックスドキュメントを小さな段落へ分割し、ユーザークエリのマッチングと直接検索に利用されます。
親子分割モード
(Parent-child Structure)
親子モード高品質ハイブリッド検索ドキュメントを大きな親チャンクと小さな子チャンクに分割。親チャンクが子チャンクを包含し、検索精度と文脈整合性の両立を実現します。
簡単なQ&A
(Simple Q&A)
Q&Aモード高品質ベクター検索表形式データをQ&A形式へと変換し、質問マッチングを通じて迅速に回答が取得できます。
LLMによるQ&Aの自動生成
(LLM Generated Q&A)
Q&Aモード高品質ベクター検索LLMによるQ&Aペアを原文テキストから自動生成し、質問マッチングで関連回答を検索します。
Markdownへの変換
(Convert to Markdown)
親子モード高品質ハイブリッド検索・重み付けスコアDOCX、XLSX、PPTXほかOfficeファイルをMarkdownへ変換し、情報処理を最適化します。※PDFは推奨されません。
テンプレートカードの「詳細」ボタンをクリックすると、ポップアップでオーケストレーション構造、パイプライン説明、チャンキング構造を確認できます。内容を確認してこのナレッジベースパイプラインを使用をクリックすれば、そのテンプレートでオーケストレーションを開始できます。 テンプレート詳細

カスタマイズ済み(Customized)

カスタマイズ済みテンプレート カスタマイズ済みテンプレートはユーザーが作成・公開したナレッジパイプラインです。テンプレートの選択、DSLのエクスポート、詳細情報の確認が可能です。 テンプレート操作 テンプレートカードの選択または詳細プレビューからこのナレッジベースパイプラインを使用を押せば、そのテンプレートでナレッジベースを作成できます。「…」メニューから、情報編集・ナレッジパイプラインのエクスポート・テンプレート削除も可能です。

3. ナレッジパイプラインをインポートする

ナレッジパイプラインのインポート 以前にエクスポートしたナレッジパイプラインのDSLファイルをインポートすれば、既存の設定を再利用したり、異なるシナリオ向けに修正を加えたりできます。画面左下のDSLファイルからインポートをクリックしてください。 ナレッジパイプラインのオーケストレーションが完了したら、ナレッジパイプラインを保存してエクスポートし、他のユーザーと共有できます。ナレッジベースユーザーは、ナレッジパイプラインをインポートすることで、既存のナレッジパイプラインを迅速に再利用し、さまざまなシナリオやニーズに合わせて変更できます。ナレッジパイプラインも同様のYAMLフォーマットでワークフローや構成を定義します。 ナレッジパイプラインには、以下のものが含まれます:
項目説明
データソースローカルファイル、ウェブサイト、オンラインドキュメント、オンラインドライブ、ウェブクローラー
データ処理ドキュメント抽出、コンテンツ分割、クリーニング戦略
ナレッジベース設定インデックス方式、検索設定、保存パラメータ
ノードオーケストレーションノードの配置および処理順序(ノードは処理の実行単位です)
ユーザー入力フォームカスタムパラメータ入力フィールド(設定がある場合)