テキスト抽出ツール

定義

LLM（大規模言語モデル）は文書の内容を直接読み取ることができません。そのため、ユーザーがアップロードした文書を”テキスト抽出ツールノード”を介して解析し、文書ファイルの情報を読み取り、テキストに変換して内容をLLMに送信する必要があります。

適用シナリオ

ファイルに対話できるLLMアプリを構築する、例えばChatPDFやChatWord；
ユーザーがアップロードしたファイルの内容を分析およびチェックする；

ノードの機能

テキスト抽出ツールノードは、情報を処理する中心的な役割を果たします。入力変数内のファイルを識別して読み取り、情報を抽出し、string型の出力変数に変換して、下流のノードが呼び出すために提供します。

テキスト抽出ツールノードは、入力変数と出力変数に分かれています。

入力変数

テキスト抽出ツールは以下のデータ構造の変数のみを受け入れます：

File，1つのファイル
Array[File]，複数のファイル

テキスト抽出ツールは、テキスト、Markdown、PDF、HTML、DOCX形式のファイルなどの文書タイプから情報を抽出できますが、画像、音声、映像などの形式のファイルは処理できません。

出力変数

出力変数はtextという固定の名前です。出力変数の型は入力変数に依存します：

入力変数がFileの場合、出力変数はstringです。
入力変数がArray[File]の場合、出力変数はarray[string]です。

Array配列変数は通常、リスト操作ノードと組み合わせて使用されます。詳細については、リスト操作を参照してください。

設定例

典型的なファイルインタラクションの質疑応答シナリオでは、テキスト抽出ツールはLLMノードの前段階として機能し、アプリのファイル情報を抽出し、LLMノードに渡してユーザーのファイルに関する質問に回答します。

このセクションでは、典型的なChatPDFサンプルワークフローテンプレートを用いて、テキスト抽出ツールノードの使用方法を説明します。

設定手順：

アプリでファイルアップロード機能を有効にします。 “スタート” ノードで単一ファイル変数を追加し、pdfと名付けます。
テキスト抽出ツールノードを追加し、入力変数でpdf変数を選択します。
LLMノードを追加し、システムプロンプトでテキスト抽出ツールノードの出力変数を選択します。LLMはこの出力変数を使用してファイルの内容を読み取ることができます。

エンドノードを設定し、LLMノードの出力変数を選択します。

設定が完了すると、アプリケーションはファイルアップロード機能を持ち、ユーザーはPDFファイルをアップロードして対話を展開できるようになります。

チャット対話でファイルをアップロードしLLMと対話する方法については、追加機能を参照してください。

このページを編集する

直接貢献することでドキュメントの改善にご協力ください

問題を報告する

エラーを見つけたり提案がありますか？お知らせください

入門

マニュアル

ハンドオン工房

コミュニティ

プラグイン

開発

もっと読む

ポリシー

テキスト抽出ツール

定義

適用シナリオ

ノードの機能

入力変数

出力変数

設定例

このページを編集する

問題を報告する

入門

マニュアル

ハンドオン工房

コミュニティ

プラグイン

開発

もっと読む

ポリシー

​定義

​適用シナリオ

​ノードの機能

​入力変数

​出力変数

​設定例

このページを編集する

問題を報告する

定義

適用シナリオ

ノードの機能

入力変数

出力変数

設定例