レッスン 4：カンニングペーパー（ナレッジ検索）

⚠️ このドキュメントは AI によって自動翻訳されています。不正確な部分がある場合は、英語版を参照してください。

前回までのレッスンで、AI メールアシスタントは基本的なメールを作成できるようになりました。しかし、もし顧客が具体的な料金プランや返金ポリシーについて質問した場合、AI はハルシネーション（Hallucination）を起こす可能性があります。つまり、自信満々にでたらめを言ってしまうということです。 AI のハルシネーションを防ぐにはどうすればよいでしょうか？答えは、カンニングペーパーを渡すことです。

検索拡張生成（RAG）とは

この技術の正式名称は RAG（Retrieval-Augmented Generation）です。これは、AI を一般的なレシピを暗記しているシェフから、カウンターに専用のレシピブックを置いているシェフに変えるようなものです。これは 3 つのシンプルなステップで行われます。 1. 検索（Retrieval）- レシピを探す ユーザーが質問すると、AI はあなたのレシピブック（アップロードしたファイル）をめくって、最も関連性の高いページを探します。例：誰かがおばあちゃん特製のアップルパイを注文します。あなたはその特定のレシピページを探しに行きます。 2. 拡張（Augmentation）- 材料を準備する AI はその特定のレシピを目の前に置き、記憶に頼る必要がないようにします。例：レシピをカウンターに広げ、必要なリンゴとシナモンを正確に準備します。 3. 生成（Generation）- 焼き上げる AI は見つけた事実のみに基づいて回答を作成します。例：レシピ通りに正確にパイを焼き、市販の一般的なものではなく、おばあちゃんの味を再現します。

ナレッジ検索ノード

これは、AI アシスタントの隣に参考資料の束を置くようなものです。ユーザーが質問すると、AI はまずこのカンニングペーパーをめくって最も関連性の高いページを探します。そして、見つけた内容とユーザーの元の質問を組み合わせて、最適な回答を考えます。この実践では、ナレッジ検索ノードを使用して AI アシスタントに公式のカンニングペーパーを提供し、回答が常に事実に基づいたものになるようにします。

ハンズオン 1：ナレッジベースを作成する

ライブラリに入る

上部ナビゲーションバーのナレッジをクリックし、ナレッジを作成をクリックします。

Dify では Notion やウェブサイトから同期することもできますが、今日はデバイスからファイルをアップロードしましょう。こちらをクリックして、後でアップロードする Dify Intro をダウンロードしてください。

ファイルをアップロードする

ファイルからインポートをクリックします。次に、先ほどダウンロードしたファイルを選択してアップロードします。

テキスト分割のステップ

関連性の高いチャンクは、AI アプリケーションが正確で包括的な回答を提供するために不可欠です。長い本を想像してみてください。500 ページの中から 1 つの文を見つけるのは大変です。Dify は本をさまざまなナレッジカードに分割し、正しい答えをより速く見つけられるようにします。チャンク構造ここでは、Dify が長いテキストを自動的に小さく検索しやすいチャンクに分割します。ここでは通用モードのままにしておきましょう。

インデックス方法

高品質：LLM モデルを使用してドキュメントを処理し、より正確な検索を実現して、LLM が高品質な回答を生成できるようにします。
エコノミー：チャンクごとに 10 個のキーワードを使用して検索を行います。トークンは消費されませんが、検索精度は低下します。

検索設定

ドキュメントの処理が完了したら、検索設定の最終確認を行います。ここでは、Dify が情報を検索する方法を設定できます。エコノミーモードでは、転置インデックスのみが利用可能です。

転置インデックス これは Dify が使用するデフォルトの構造です。本の巻末にある索引のようなもので、重要な用語が一覧表示され、それらがどのページに出現するかを Dify に正確に伝えます。これにより、Dify は最初から本全体を読むのではなく、キーワードに基づいて適切なナレッジカードに即座にジャンプできます。
Top K 3 に設定されたスライダーが表示されます。これは Dify に次のように指示しています：ユーザーが質問したとき、レシピブックから最も関連性の高い上位 3 枚のナレッジカードを見つけて AI に表示せよ。値を高く設定すると、AI はより多くのコンテキストを読むことができますが、高すぎると情報過多になる可能性があります。

今のところ、デフォルト設定のままにしておきましょう。現在のニーズに十分対応できる設定になっています。

保存して処理する

保存して処理をクリックします。ナレッジベースの準備が完了しました。

素晴らしい！最初のナレッジベースの作成に成功しました。次に、このナレッジベースを使って AI メールアシスタントをアップグレードしましょう。

ハンズオン 2：ナレッジ検索ノードを追加する

ノードを追加する

メールアシスタントのワークフローに戻ります。
開始ノードと LLM ノードの間の線にカーソルを合わせます。
**プラス（+）**アイコンをクリックし、ナレッジ検索ノードを選択します。

ナレッジベースを接続する

ノードをクリックし、右側のパネルに移動します。
ナレッジの横にある**プラス（+）**ボタンをクリックしてナレッジを追加します。
What’s Dify を選択し、追加をクリックします。

クエリテキストを設定する

ナレッジベースの準備ができました。では、AI がナレッジベースを参照してメールの回答を検索するようにするにはどうすればよいでしょうか？パネルにとどまり、上部のクエリテキストに移動して、email_content を選択します。これにより、AI に次のように指示しています：*顧客のメッセージを検索キーワードとして使用し、レシピブックをめくって一致する情報を見つけよ。*クエリがなければ、AI は閉じた本を見つめているだけです。

このようにして、メールアシスタントは顧客の元のメールを検索キーワードとして使用し、ナレッジベースから最も関連性の高い回答を見つけます。

ハンズオン 3：メールアシスタントをアップグレードする

ナレッジベースの準備ができました。次に、LLM ノードに返信を生成する前にナレッジをコンテキストとして実際に読むよう指示する必要があります。

コンテキストを追加する

LLM ノードをクリックします。コンテキストという新しいセクションが表示されます。
それをクリックし、ナレッジ検索ノードの result を選択します。

プロンプトを更新する

AI にコンテキストに基づいて返信を生成するよう指示する必要があります。System に、追加の要件として Generate response based on / と入力し、Context を選択します。

お疲れ様でした！ 最も難しい部分を完了しました。これで、メールアシスタントは返信を生成する際に参照できるナレッジベースを持っています。どのように動作するか見てみましょう。以下のサンプルテキストを使って自由にテストしてみてください。

顧客名：Amanda

メール原文：
Hi,

What does the name 'Dify' actually stand for, and what can it do for my business?

Best regards,
Amanda

結果を確認すると、一般的な推測ではなく、AI がナレッジベースを参照して Dify の意味を説明していることがわかります。

ミニチャレンジ

顧客がナレッジベースにない質問をした場合、どうなりますか？
ナレッジベースとしてどのような情報をアップロードできますか？
チャンク構造、インデックス方法、検索設定を探索してみましょう。

​検索拡張生成（RAG）とは

​ナレッジ検索ノード

​ハンズオン 1：ナレッジベースを作成する

​ハンズオン 2：ナレッジ検索ノードを追加する

​ハンズオン 3：メールアシスタントをアップグレードする

​ミニチャレンジ

検索拡張生成（RAG）とは

ナレッジ検索ノード

ハンズオン 1：ナレッジベースを作成する

ハンズオン 2：ナレッジ検索ノードを追加する

ハンズオン 3：メールアシスタントをアップグレードする

ミニチャレンジ