テキスト抽出ツール
Last updated
Last updated
LLM(大規模言語モデル)は文書の内容を直接読み取ることができません。そのため、ユーザーがアップロードした文書を”テキスト抽出ツールノード”を介して解析し、文書ファイルの情報を読み取り、テキストに変換して内容をLLMに送信する必要があります。
ファイルに対話できるLLMアプリを構築する、例えばChatPDFやChatWord;
ユーザーがアップロードしたファイルの内容を分析およびチェックする;
テキスト抽出ツールノードは、情報を処理する中心的な役割を果たします。入力変数内のファイルを識別して読み取り、情報を抽出し、string型の出力変数に変換して、下流のノードが呼び出すために提供します。
テキスト抽出ツールノードは、入力変数と出力変数に分かれています。
テキスト抽出ツールは以下のデータ構造の変数のみを受け入れます:
File
,1つのファイル
Array[File]
,複数のファイル
テキスト抽出ツールは、テキスト、Markdown、PDF、HTML、DOCX形式のファイルなどの文書タイプから情報を抽出できますが、画像、音声、ビデオなどの形式のファイルは処理できません。
出力変数はtext
という固定の名前です。出力変数の型は入力変数に依存します:
入力変数がFile
の場合、出力変数はstring
です。
入力変数がArray[File]
の場合、出力変数はarray[string]
です。
Array配列変数は通常、リスト操作ノードと組み合わせて使用されます。詳細については、リスト処理を参照してください。
典型的なファイルインタラクションの質疑応答シナリオでは、テキスト抽出ツールはLLMノードの前段階として機能し、アプリのファイル情報を抽出し、LLMノードに渡してユーザーのファイルに関する質問に回答します。
このセクションでは、典型的なChatPDFサンプルワークフローテンプレートを用いて、テキスト抽出ツールノードの使用方法を説明します。
設定手順:
アプリでファイルアップロード機能を有効にします。 “スタート” ノードで単一ファイル変数を追加し、pdf
と名付けます。
テキスト抽出ツールノードを追加し、入力変数でpdf
変数を選択します。
LLMノードを追加し、システムプロンプトでテキスト抽出ツールノードの出力変数を選択します。LLMはこの出力変数を使用してファイルの内容を読み取ることができます。
終了ノードを構成し、終了ノードでLLMノードの出力変数を選択します。
設定が完了すると、アプリはファイルアップロード機能を備え、ユーザーはPDFファイルをアップロードして会話を展開できます。
チャット対話でファイルをアップロードし、LLMと対話する方法については、追加機能を参照してください。