1.2 Webサイトからデータをインポート
Last updated
Was this helpful?
Last updated
Was this helpful?
Dify のナレッジベースでは、やを利用してウェブページをスクレイピングし、解析したデータをMarkdownの形式でナレッジベースに取り込むことができます。
右上隅にあるアバターをクリックし、DataSourceページでFirecrawlの認証情報を設定する必要があります。
ナレッジベース作成のページでSync from websiteを選択し、スクレイピングの対象どしてのウェブページのURLを入力します。
設定項目には、サブページのスクレイピング、スクレイピングするページの上限、ページのスクレイピング深度、ページの除外、指定ページのみのスクレイピング、コンテンツの抽出などが含まれます。設定が完了したら Run をクリックし、解析結果のページをプレビューします。
解析されたテキストをナレッジベースのドキュメントにインポートし、結果を確認します。Add URL をクリックすると、新しいウェブページをさらにインポートできます。
右上隅にあるアバターをクリックし、DataSourceページでJina Readerの認証情報を設定する必要があります。
ナレッジベース作成のページでSync from websiteを選択し、スクレイピングの対象どしてのウェブページのURLを入力します。
設定項目には、サブページをクロールするかどうか、クロールされるページ数の上限、サイトマップのクロールを使用するかどうかなどがあります。設定が完了したら Run をクリックし、解析結果のページをプレビューします。
解析されたテキストをナレッジベースのドキュメントにインポートし、結果を確認します。Add URL をクリックすると、新しいウェブページをさらにインポートできます。
クロールが完了すると、Web ページのコンテンツがナレッジ ベースに組み込まれます。
にログインして登録を完了し、APIキーを取得してから入力し、保存します。
にログインして登録を完了し、APIキーを取得してから入力し、保存します。