
1. ゼロから作成する

2. テンプレートから作成する
Difyは2種類のテンプレートを提供しています:内部パイプラインとカスタマイズ済み。どちらもカード上にナレッジベース名、説明、タグ(チャンキング構造など)が表示されます。
内部パイプライン(Built-in Pipeline)
内部パイプラインはDify公式があらかじめ用意したナレッジベーステンプレートで、一般的なドキュメント構造やユースケースに最適化されています。使用したいテンプレートの「選択」をクリックするだけで導入できます。
| テンプレート名 | チャンキング構造 | インデックス方式 | 検索設定 | 説明 |
|---|---|---|---|---|
| 汎用分割モード (General Mode) | 汎用モード | 省リソース | 逆インデックス | ドキュメントを小さな段落へ分割し、ユーザークエリのマッチングと直接検索に利用されます。 |
| 親子分割モード (Parent-child Structure) | 親子モード | 高品質 | ハイブリッド検索 | ドキュメントを大きな親チャンクと小さな子チャンクに分割。親チャンクが子チャンクを包含し、検索精度と文脈整合性の両立を実現します。 |
| 簡単なQ&A (Simple Q&A) | Q&Aモード | 高品質 | ベクター検索 | 表形式データをQ&A形式へと変換し、質問マッチングを通じて迅速に回答が取得できます。 |
| LLMによるQ&Aの自動生成 (LLM Generated Q&A) | Q&Aモード | 高品質 | ベクター検索 | LLMによるQ&Aペアを原文テキストから自動生成し、質問マッチングで関連回答を検索します。 |
| Markdownへの変換 (Convert to Markdown) | 親子モード | 高品質 | ハイブリッド検索・重み付けスコア | DOCX、XLSX、PPTXほかOfficeファイルをMarkdownへ変換し、情報処理を最適化します。※PDFは推奨されません。 |

カスタマイズ済み(Customized)


3. ナレッジパイプラインをインポートする

| 項目 | 説明 |
|---|---|
| データソース | ローカルファイル、ウェブサイト、オンラインドキュメント、オンラインドライブ、ウェブクローラー |
| データ処理 | ドキュメント抽出、コンテンツ分割、クリーニング戦略 |
| ナレッジベース設定 | インデックス方式、検索設定、保存パラメータ |
| ノードオーケストレーション | ノードの配置および処理順序(ノードは処理の実行単位です) |
| ユーザー入力フォーム | カスタムパラメータ入力フィールド(設定がある場合) |