⚠️ このドキュメントは AI によって自動翻訳されています。不正確な部分がある場合は、英語版を参照してください。
チャットボットは会話ごとに最大 500 メッセージまたは 2,000 token の履歴を保持します。いずれかの上限を超えた場合、新しいメッセージのために古いメッセージから順に削除されます。
設定
プロンプトの作成
プロンプトは、モデルに何をすべきか、どのように応答すべきか、どのような制約に従うべきかを伝えます。会話全体を通じてモデルの振る舞いを形作るため、一回限りのタスクではなく、一貫したペルソナを定義するものと考えてください。 効果的なプロンプトを書くためのヒント:- ペルソナを定義する: モデルが誰として振る舞い、どのようなトーンを使用すべきかを記述します。
- 出力形式を指定する: 期待する構造、長さ、スタイルを記述します。
- 制約を設定する: モデルが避けるべきことや従うべきルールを伝えます。
変数を使った動的プロンプトの作成
毎回プロンプトを書き直すことなく、異なるユーザーやコンテキストにチャットボットを適応させるには、変数を追加して必要な情報を事前に収集します。 変数はプロンプト内のプレースホルダーです。各変数は入力フィールドとして表示され、ユーザーが会話開始前に入力し、その値が実行時にプロンプトに挿入されます。ユーザーは会話中に変数の値を更新することもでき、プロンプトはそれに応じて調整されます。 たとえば、オンボーディングアシスタントではrole と language を使って回答をカスタマイズできます:
- 短文
- 段落
- 選択
- 数値
- チェックボックス
- API ベースの変数
最大 256 文字まで入力可能です。名前、メールアドレス、タイトルなど、1 行に収まる短いテキスト入力に使用します。
ラベル名 は、エンドユーザーに各入力フィールドとして表示される名前です。
AI でプロンプトを生成・改善する
何から始めればよいかわからない場合や、既存のプロンプトを改善したい場合は、生成 をクリックして LLM にドラフトを作成させましょう。 ゼロから望む内容を記述するか、current_prompt を参照して改善点を指定します。より的確な結果を得るには、理想的な出力 にサンプルを追加してください。
生成のたびにバージョンとして保存されるため、自由に実験してロールバックできます。
独自データに基づいた回答
一般的な知識ではなく独自のデータに基づいてモデルの回答を生成するには、ナレッジベースを追加します。 ユーザーがメッセージを送信するたびに、そのメッセージが検索クエリとしてナレッジベースから関連コンテンツを取得し、モデルへのコンテキストとしてプロンプトに挿入されます。アプリレベルの検索設定
検索結果の処理方法を微調整するには、検索設定 をクリックします。検索設定にはナレッジベースレベルとアプリレベルの 2 つのレイヤーがあります。2 つの連続するフィルターと考えてください。ナレッジベース設定が結果の初期プールを決定し、アプリ設定がさらに結果をリランクまたはプールを絞り込みます。
-
リランク設定
- ウェイト設定 リランク時のセマンティック類似度とキーワードマッチングの相対的な重みです。セマンティックの重みを高くすると意味的な関連性が重視され、キーワードの重みを高くすると完全一致が重視されます。 ウェイト設定は、追加されたすべてのナレッジベースが 高品質 モードでインデックスされている場合のみ利用可能です。
-
リランクモデル
クエリとの関連性に基づいてすべての結果を再スコアリングし、並べ替えるリランクモデルです。
マルチモーダルのナレッジベースが追加されている場合は、マルチモーダルリランクモデル(Vision タグ付き)も選択してください。そうしないと、検索された画像がリランクと最終出力から除外されます。
- Top K リランク後に返す上位結果の最大数です。 リランクモデルが選択されている場合、この値はモデルの最大入力容量(モデルが一度に処理できるテキスト量)に基づいて自動的に調整されます。
- スコアしきい値 返される結果の最小類似度スコアです。このしきい値を下回る結果は除外されます。厳密な関連性にはより高いしきい値を、より広範なマッチングにはより低いしきい値を使用してください。
特定ドキュメント内の検索
デフォルトでは、検索はナレッジベース全体を対象とします。検索を特定のドキュメントに制限するには、手動または自動のメタデータフィルタリングを有効にします。 これにより検索精度が向上します。特にナレッジベースが大規模な場合や、異なるコンテキストのコンテンツが含まれている場合に有効です。 ドキュメントメタデータの作成と管理については、メタデータを参照してください。マルチモーダル入力の処理
エンドユーザーがファイルをアップロードできるようにするには、対応するマルチモーダル機能を持つモデルを選択します。モデルがサポートしている場合、関連するファイルタイプのトグル(ビジョン、音声、ドキュメント)が表示され、必要に応じて有効にできます。 ビジョン の下にある 設定 をクリックして、ファイルの受け入れと処理方法を設定します。アップロード設定は、有効なすべてのファイルタイプに適用されます。-
解像度: 画像 処理のみの詳細レベルを制御します。
- 高: 複雑な画像ではより高い精度が得られますが、より多くの token を使用します
- 低: シンプルな画像では、より少ない token で高速に処理します
- アップロード方法: ユーザーがデバイスからアップロード、URL の貼り付け、またはその両方を選択できます。
- アップロード制限: ユーザーが 1 メッセージあたりにアップロードできるファイルの最大数です。
セルフホスト環境では、以下の環境変数でファイルサイズの上限を調整できます:
UPLOAD_IMAGE_FILE_SIZE_LIMIT(デフォルト: 10 MB)UPLOAD_FILE_SIZE_LIMIT(デフォルト: 15 MB)UPLOAD_AUDIO_FILE_SIZE_LIMIT(デフォルト: 50 MB)

