ツール

ツール定義

ツールは、ネット検索、科学計算、画像の描画などの機能を追加し、大規模言語モデル(LLM)の能力を拡張して外部世界と接続する力を与えます。Difyは2種類のツールを提供しています:第一方ツールカスタムAPIツールです。

Difyエコシステムが提供する第一方ツールを直接使用することができ、また、OpenAPI/SwaggerおよびOpenAIプラグイン規格をサポートするカスタムAPIツールを簡単にインポートできます。

ツールの役割:

  1. ツールを使用すると、Dify上でより強力なAIアプリケーションを作成できます。例えば、エージェント型アプリケーションに適切なツールを組み合わせることで、タスク推論、ステップの分解、ツールの呼び出しを通じて複雑なタスクを完了させることができます。

  2. あなたのアプリケーションを他のシステムやサービスと連携させ、外部環境と対話できるようにします。例えば、コードの実行や専用情報源へのアクセスなどです。

第一方ツールの設定方法

Difyは現在、以下のツールをサポートしています:

ツールツールの説明

Google検索

Google SERP検索を実行し、スニペットやウェブページを抽出するツール。入力は検索クエリであるべきです。

ウィキペディア

ウィキペディア検索を実行し、スニペットやウェブページを抽出するツール。

DALL-E

自然言語入力を通じて高品質な画像を生成するツール。

ウェブスクレイピング

ウェブページデータをクロールするためのツール。

WolframAlpha

質問に基づいた標準化された回答を提供し、強力な数学計算機能を持つ知識エンジン。

可視化チャート生成

棒グラフ、折れ線グラフ、円グラフなどの可視化チャートを生成するツール。

現在時刻

現在の時刻を問い合わせるツール。

Yahooファイナンス

最新のニュース、株価情報などの財務情報を取得して整理するツール。

Stable Diffusion

ローカルに展開可能な画像生成ツールで、stable-diffusion-webuiを使用して展開できます。

ベクトライザー

PNGおよびJPG画像をSVGベクトル画像に迅速かつ簡単に変換するツール。

YouTube

YouTubeチャンネルの動画統計データを取得するためのツール。

Difyに自分で開発したツールを貢献することを歓迎します。貢献方法についてはDify開発貢献ドキュメントを確認してください。あなたのサポートは私たちにとって非常に貴重です。

第一方ツールの認証

Difyエコシステムが提供する第一方内蔵ツールを直接使用する場合、使用前に適切な認証情報を設定する必要があります。

認証情報の検証が成功すると、ツールは「認証済み」の状態になります。認証情報が設定されると、ワークスペース内のすべてのメンバーがアプリケーションの編成時にこのツールを使用できます。

カスタムツールの作成方法

「ツール-カスタムツール」内でカスタムAPIツールをインポートできます。現在、OpenAPI / SwaggerおよびChatGPTプラグイン規格をサポートしています。OpenAPIスキーマの内容を直接貼り付けるか、URLからインポートすることができます。OpenAPI / Swagger規格については公式ドキュメントを参照してください。

ツールは現在、2種類の認証方式をサポートしています:無認証とAPIキー。

スキーマ内容をインポートすると、システムはファイル内のパラメータを自動的に解析し、ツールの具体的なパラメータ、方法、パスをプレビューできます。ここでツールのパラメータをテストすることもできます。

カスタムツールの作成が完了すると、ワークスペース内のすべてのメンバーが「スタジオ」内でアプリケーションを編成する際にこのツールを使用できます。

Cloudflare Workers

dify-tools-workerを使用してカスタムツールを迅速に展開することもできます。このツールは以下を提供します:

  • Difyにインポート可能なルーティング https://difytoolsworker.yourname.workers.dev/doc、OpenAPI互換のインターフェースドキュメントを提供します。

  • APIの実装コードを提供し、Cloudflare Workersに直接展開できます。

アプリ内でツールを使用する方法

現在、「スタジオ」でエージェント型アプリケーションを作成する際に、認証情報が設定されたツールを使用することができます。

以下の図のように、財務分析アプリケーションにツールを追加すると、エージェントは必要に応じてツールを自動的に呼び出し、ツールから財務報告データを取得し、それを解析してユーザーとの対話を完了します。

Last updated