テキスト抽出ツール

定義

LLM(大規模言語モデル)は文書の内容を直接読み取ることができません。そのため、ユーザーがアップロードした文書を”テキスト抽出ツールノード”を介して解析し、文書ファイルの情報を読み取り、テキストに変換して内容をLLMに送信する必要があります。

適用シナリオ

  • ファイルに対話できるLLMアプリを構築する、例えばChatPDFやChatWord;

  • ユーザーがアップロードしたファイルの内容を分析およびチェックする;

ノードの機能

テキスト抽出ツールノードは、情報を処理する中心的な役割を果たします。入力変数内のファイルを識別して読み取り、情報を抽出し、string型の出力変数に変換して、下流のノードが呼び出すために提供します。

テキスト抽出ツールノード

テキスト抽出ツールノードは、入力変数と出力変数に分かれています。

入力変数

テキスト抽出ツールは以下のデータ構造の変数のみを受け入れます:

  • File,1つのファイル

  • Array[File],複数のファイル

テキスト抽出ツールは、テキスト、Markdown、PDF、HTML、DOCX形式のファイルなどの文書タイプから情報を抽出できますが、画像、音声、ビデオなどの形式のファイルは処理できません。

出力変数

出力変数はtextという固定の名前です。出力変数の型は入力変数に依存します:

  • 入力変数がFileの場合、出力変数はstringです。

  • 入力変数がArray[File]の場合、出力変数はarray[string]です。

Array配列変数は通常、リスト操作ノードと組み合わせて使用されます。詳細については、リスト処理を参照してください。

設定例

典型的なファイルインタラクションの質疑応答シナリオでは、テキスト抽出ツールはLLMノードの前段階として機能し、アプリのファイル情報を抽出し、LLMノードに渡してユーザーのファイルに関する質問に回答します。

このセクションでは、典型的なChatPDFサンプルワークフローテンプレートを用いて、テキスト抽出ツールノードの使用方法を説明します。

ChatPDF ワークフロー

設定手順:

  1. アプリでファイルアップロード機能を有効にします。 “スタート” ノードで単一ファイル変数を追加し、pdfと名付けます。

  2. テキスト抽出ツールノードを追加し、入力変数でpdf変数を選択します。

  3. LLMノードを追加し、システムプロンプトでテキスト抽出ツールノードの出力変数を選択します。LLMはこの出力変数を使用してファイルの内容を読み取ることができます。

テキスト抽出ツールの出力変数を入力
  1. 終了ノードを構成し、終了ノードでLLMノードの出力変数を選択します。

設定が完了すると、アプリはファイルアップロード機能を備え、ユーザーはPDFファイルをアップロードして会話を展開できます。

チャット対話でファイルをアップロードし、LLMと対話する方法については、追加機能を参照してください。

Last updated