敏感内容审查

该模块用于审查应用中终端用户输入的内容和 LLM 输出的内容,分为两个扩展点类型。

扩展点

  • app.moderation.input 终端用户输入的内容审查扩展点

    • 用于审查终端用户传入的变量内容以及对话型应用中对话的输入内容。

  • app.moderation.outputLLM 输出的内容审查扩展点

    • 用于审查 LLM 输出的内容,

    • 当 LLM 输出为流式时,输出的内容将分 100 字为一个分段进行请求 API,尽可能避免输出内容较长时,审查不及时的问题。

app.moderation.input 扩展点

Request Body

{
    "point": "app.moderation.input", // 扩展点类型,此处固定为 app.moderation.input
    "params": {
        "app_id": string,  // 应用 ID
        "inputs": {  // 终端用户传入变量值,key 为变量名,value 为变量值
            "var_1": "value_1",
            "var_2": "value_2",
            ...
        },
        "query": string | null  // 终端用户当前对话输入内容,对话型应用固定参数。
    }
}
  • Example

    • {
          "point": "app.moderation.input",
          "params": {
              "app_id": "61248ab4-1125-45be-ae32-0ce91334d021",
              "inputs": {
                  "var_1": "I will kill you.",
                  "var_2": "I will fuck you."
              },
              "query": "Happy everydays."
          }
      }

API 返回

{
    "flagged": bool,  // 是否违反校验规则
    "action": string, // 动作,direct_output 直接输出预设回答; overrided 覆写传入变量值
    "preset_response": string,  // 预设回答(仅当 action=direct_output 返回)
    "inputs": {  // 终端用户传入变量值,key 为变量名,value 为变量值(仅当 action=overrided 返回)
        "var_1": "value_1",
        "var_2": "value_2",
        ...
    },
    "query": string | null  // 覆写的终端用户当前对话输入内容,对话型应用固定参数。(仅当 action=overrided 返回)
}
  • Example

    • action=``direct_output

      • {
            "flagged": true,
            "action": "direct_output",
            "preset_response": "Your content violates our usage policy."
        }
    • action=overrided

      • {
            "flagged": true,
            "action": "overrided",
            "inputs": {
                "var_1": "I will *** you.",
                "var_2": "I will *** you."
            },
            "query": "Happy everydays."
        }

app.moderation.output 扩展点

Request Body

{
    "point": "app.moderation.output", // 扩展点类型,此处固定为 app.moderation.output
    "params": {
        "app_id": string,  // 应用 ID
        "text": string  // LLM 回答内容。当 LLM 输出为流式时,此处为 100 字为一个分段的内容。
    }
}
  • Example

    • {
          "point": "app.moderation.output",
          "params": {
              "app_id": "61248ab4-1125-45be-ae32-0ce91334d021",
              "text": "I will kill you."
          }
      }

API 返回

{
    "flagged": bool,  // 是否违反校验规则
    "action": string, // 动作,direct_output 直接输出预设回答; overrided 覆写传入变量值
    "preset_response": string,  // 预设回答(仅当 action=direct_output 返回)
    "text": string  // 覆写的 LLM 回答内容。(仅当 action=overrided 返回)
}
  • Example

    • action=direct_output

      • {
            "flagged": true,
            "action": "direct_output",
            "preset_response": "Your content violates our usage policy."
        }
    • action=overrided

      • {
            "flagged": true,
            "action": "overrided",
            "text": "I will *** you."
        }

最后更新于