メインコンテンツへスキップ
⚠️ このドキュメントはAIによって自動翻訳されています。不正確な部分がある場合は、英語版を参照してください。

はじめに

Dify の「ナレッジ」は、あなた自身のデータを統合し、AI アプリに活用できる仕組みです。これにより、LLM(大規模言語モデル)に特定分野の情報を文脈として提供し、より正確で関連性の高い、幻覚(誤情報)の少ない応答を実現します。 この仕組みは RAG(Retrieval-Augmented Generation/検索拡張生成) によって支えられています。これは、モデルが事前学習された一般公開データだけに依存するのではなく、あなたの独自ナレッジを追加の信頼ソースとして利用するという意味です。
  1. (検索/Retrieval) ユーザーが質問をすると、システムはまずナレッジから最も関連性の高い情報を検索します。
  2. (拡張/Augmented) 取得された情報はユーザーの質問文と組み合わせられ、拡張文脈として LLM に渡されます。
  3. (生成/Generation) LLM はその文脈をもとに、より精度の高い回答を生成します。
ナレッジは「ナレッジベース」に保存・管理されます。用途やドメイン、データソースごとに複数のナレッジベースを作成でき、アプリケーションのニーズに応じて選択的に統合することが可能です。

ナレッジで構築する

Dify のナレッジ機能を利用すれば、独自データや専門知識を基盤とした AI アプリを構築できます。代表的なユースケースは以下の通りです。
  • カスタマーサポートチャットボット:最新の製品ドキュメント、FAQ、トラブルシューティングガイドから正確な回答を提供する、より賢いサポートボットを構築。
  • 社内ナレッジポータル:従業員が会社のポリシーや手順を迅速にアクセスできる AI 検索・Q&A システムを構築。
  • コンテンツ生成ツール:特定分野の資料やバックグラウンド情報をもとに、レポート、記事、メールなどを生成する知的ライティングツールを構築。
  • リサーチ・分析アプリケーション:学術論文、市場レポート、法的文書などの特定の知識リポジトリから情報を検索・要約するリサーチ支援アプリを構築。

ナレッジの作成

ナレッジの管理と最適化

  • コンテンツ管理:ドキュメントやチャンクを閲覧・追加・編集・削除して、ナレッジを常に最新・正確・検索可能な状態に保ちましょう。
  • 検索検証:ユーザーの質問をシミュレートして、ナレッジベースの検索精度を確認。
  • メタデータによる検索強化:ドキュメントにメタデータを追加し、フィルタ検索を有効化して検索精度をさらに向上。
  • ナレッジベース設定の調整:インデックス方式、埋め込みモデル、検索戦略をいつでも変更可能。

ナレッジの利用

アプリケーションへの統合:AI アプリを自社データに基づかせることが可能。
関連資料