作者:Alec Lee|AX 全球战略师 & 全栈探索者。若您发现文中存在不足或改进空间,欢迎随时联系我。
本次选择的应用场景是:名车 AI 数字导购,她的名字叫 Vendy。我们将用最简单易懂的方式,一步步搭建一个会 “听、说、想、演” 的 AI 数字销售助理。
本项目所涉及的产品:Dify × TEN × Trulience × Azure × Agora × OpenAI。
“会听说想演”的 AI 数字人助理由哪部分构成?本项目将集成六大平台,构建一个具备完整对话能力的名品车 AI 销售数字人(AI Sales Avatar)——Vendy。
她能“听、说、想、演” —— 也就是:聆听用户提问、思考应答、语音回复,并以数字人形象呈现。
👇 下图展示了系统整体集成架构图:
👇 下图展示了系统中各平台的集成模块与工作流程:
Dify + OpenAI:搭建智能体,支持调用企业内部数据与 OpenAI API,并向 TEN 提供统一的对话接口(API)。
Trulience:提供数字人演绎能力,向 TEN 提供数字人 ID 与访问 Token,用于虚拟形象呈现。
Agora:实现语音通信与视频通话,向 TEN 提供 App ID 与 Certificate(证书)。
Azure Speech:提供语音识别(STT)与语音合成(TTS)服务,向 TEN 提供以下参数:
AZURE_STT_KEY
、AZURE_STT_REGION
、AZURE_TTS_KEY
、AZURE_TTS_REGION
TEN(平台中枢):作为系统的中枢平台,统一集成并调度上述所有平台的 API、密钥与 Token, 实现 AI Sales Avatar —— Vendy 的整体智能对话流程与实时互动能力。
📌 小提示:上述平台均可根据实际需求,替换为其他开源或 SaaS 方案。
本项目所用组合为参考示例,便于学习与复用。
我们首先将在 Dify 上完成三步操作,搭建出一个基于内部数据的 AI Sales Avatar “Vendy 本体”。
👉 打开 Dify 官网,点击右上角 “Get Started”,开始注册流程。
登录 Dify 后,在左侧菜单点击 「Settings > Model Provider」(模型提供商)。在页面中找到 OpenAI 模块,点击 Install 进行安装。
在 OpenAI 模块中,点击蓝色链接 「Get your API Key from OpenAI」,系统会自动跳转到 OpenAI 官方平台。
在 OpenAI 上点击 「+ Create new secret key」 生成新的 API 密钥。
复制生成的 Key,并返回 Dify,在 OpenAI 模块中粘贴如下字段:
完成模型配置后,我们已经准备好了运行环境,
现在可以开始在 Dify 上构建 AI Sales Avatar 的知识本体了。
在 Dify 控制台顶部菜单,点击 「Knowledge」,
然后点击 「Create Knowledge」 创建一个新的知识数据集。
在接下来的页面中,选择资料上传方式,推荐使用 「Import from file」 方式。
👇 如下图所示:
请上传你已经准备好的企业内部资料,如产品介绍、销售手册、常见问题文档等。
若你还没有准备相关资料,也可以用 ChatGPT 辅助生成内容。
👇 例如我们用 ChatGPT 生成了一个名品车品牌介绍的 Word 文档(Lexus、Audi、BMW 等):
下载好文档后,回到 Dify 上传页面,选择 「Import from file」,上传该文件。
上传成功后,点击右下角的 「Next」,继续下一步设置。
默认设置已经适用于大多数场景,建议保持原样,直接点击 「Save & Process」 即可。
(如需后续提升智能体的理解精度,也可根据实际需求调整相关参数)
✅ 若你看到以下页面,表示你的文档已经成功上传并被 Dify 系统解析完成。
到这里,我们已经完成了智能体知识库的构建部分,
下一步,我们将创建一个智能体应用,并接入这个知识库!
进入 Dify 控制台,点击顶部菜单栏的 「Studio」,再点击右上角的 「Create」 创建新 App。
在弹出窗口中填写以下内容:
AI Sales Avatar
👇 设置界面如下所示:
点击 Create 后,会进入 App 的 Orchestrate 编辑界面。
在 INSTRUCTION 栏中填写与刚才 Description 一致的内容:
Your name is Vendy, the AI Clerk of Luxury Cars. Your task is to provide information about luxury cars to the customers based on the knowledge.
然后,在下方的 Knowledge 区块中,选择我们刚刚上传的知识文档作为参考资料。
👇 配置界面如下所示:
配置完成后,可以在右侧输入框测试是否能正常调用知识库内容。
如果返回的内容基于上传的文档,就说明智能体连接成功 ✅
测试无误后,点击右上角的 「Publish」,发布这个 AI 应用。
应用发布后,点击左侧菜单栏中的 「API Access」,进入后点击右上角的 「Create Secret Key」。 这个 API Key 是后续在 TEN 平台接入时必须使用的,请务必复制保存好。
👇 接口密钥生成界面如下所示:
🎉 恭喜你!至此,我们已经完成了 AI Sales Avatar 的“智能体本体”搭建,
并成功获得了用于调用的 API Key。
接下来,我们将进入 Trulience 平台,为 AI Sales Avatar 生成她的 “数字人外貌与演绎能力” ——
也就是构建她的虚拟形象,让她不仅能“听、说、想”,还能真实地出现在用户面前,与人互动!
现在,我们将为 AI Sales Avatar 赋予一个可视化的 “数字人形象”!
我们将使用 Trulience 平台来生成形象,并获取用于后续连接的 Avatar ID 与访问 Token。
✅ 操作流程如下:
1️⃣ 打开 Trulience 官网。
点击主页上的 「Start For Free」 按钮,开始注册账号。
👇 页面示意图如下:
2️⃣ 注册完成后,进入后台界面。点击左侧菜单的 「IMAGE AVATARS」,
选择一个女性角色作为 Vendy 的外貌,点击绿色按钮 「Create Avatar」 生成数字人。
👇 选择与创建界面示意图如下:
3️⃣ 当你看到 “Avatar created” 的提示时,说明数字人已经成功创建。
👇 创建成功提示界面如下所示:
3️⃣ 我们将左侧的名称从默认的 Amanda 修改为 Vendy,
此时你可以在下方看到她专属的 Avatar ID。
👇 如下图所示:
4️⃣ 接下来,点击底部按钮 「Connect」,浏览器会跳转到一个新的页面。
请从网页地址(URL)中复制 token=
后面的那段字符串,
这就是你的 访问 Token。
建议将 Avatar ID 与 Token 一并复制保存好,稍后将在 TEN 平台中使用。
🎉 恭喜你!
我们已经完成了 AI Sales Avatar 的“外貌搭建”,并成功获得了她的 Avatar ID 与访问 Token!
在将 Dify 的智能体、Trulience 的数字人接入 TEN 平台之前,我们需要提前准备好语音通信和语音识别/合成所需的账号与密钥,主要包括以下服务:
TEN 使用 Agora 来实现语音通话能力(“她会说话”),需要准备以下参数:
AGORA_APP_ID=
(App ID)AGORA_CERTIFICATE=
(Certificate)👉 获取方式:
登录 Agora 控制台 https://console.agora.io 创建一个新项目后,即可获取上述信息。
👇 控制台页面如下:
登录账号后,点击左侧栏的 「Projects」,
再点击右上角的 「Create New」 创建一个新项目。
👇 创建项目入口界面如下:
📝 输入项说明:
AISalesAvatar
Enterprise Collaboration
填写完成后,点击 「Submit」 完成项目创建。
👇 创建成功后,即可获取 App ID 和 Certificate:
项目创建成功后,将跳转到项目管理页面。
在项目列表中,点击 App ID 后方的复制按钮,即可获取 App ID。
👇 如图所示:
在获取 App ID 后,继续点击项目右侧的 ✏️ 铅笔图标(编辑按钮),进入项目详情页。
在页面底部的 Primary Certificate 区域,点击右侧的复制按钮,
即可复制该项目的 Certificate。
👇 如下图所示:
至此,我们已经成功获取 Agora 的 App ID 和 Primary Certificate,
为后续在 TEN 平台启用语音通信功能做好了准备。
📚 如需进一步了解,可参考 Agora 官方技术文档。
Azure 负责将用户的语音转为文字(STT),并将 AI 回复转成语音(TTS)。
需要准备以下 4 个环境变量:
AZURE_STT_KEY
AZURE_STT_REGION
AZURE_TTS_KEY
AZURE_TTS_REGION
👉 获取方式如下:
打开 Azure Portal,请登录 Azure 官方门户网站:
在首页点击左上角的 「Create a resource(创建资源)」, 在搜索栏中输入 Azure OpenAI,点击进入创建页面。
👇 创建入口界面如下:
参考以下内容,填写基本信息(Basics):
通常默认选择 「公共访问」 即可,允许服务通过互联网访问:
🧩 可选步骤:你可以为资源添加如 project=ai-agent
等标签,便于后续分类与管理。
👇 标签与网络配置界面如下:
📝 确认填写信息无误后,点击 「Create(创建)」 按钮,即可开始部署 Azure OpenAI 服务资源。
👇 创建部署确认界面:
👇 资源部署中画面如下:
部署完成后,进入 Azure AI Foundry,你将看到如下欢迎界面,
可用于快速创建项目与选择模型:
进入 「Model Catalog(模型目录)」 页面后,选择 Azure AI Speech:
点击 Azure-AI-Speech 模型后,进入其详细页面,
点击页面上方的 「Use Service」 按钮,即可跳转进入 Speech Playground 页面:
进入 Speech Playground,选择你的语音服务资源(如下图所示),
即可看到对应的 API Key 和 Region:
点击 「Text to Speech」 标签,进入 Voice Gallery,
可试听多种语音风格,选择最适合你 AI Avatar 的声音类型:
点击 「View Code」,即可复制当前语音服务的 API Key 和 Region:
🎉 恭喜你!
至此,我们已经完成了 TEN 平台运行所需的所有参数准备工作 ✅
🧱 下一步,我们就可以正式在本地启动 TEN Agent 平台。并将前面搭建的所有模块:
完整串联起来,构建真正“听说想演”的实时 AI 数字销售助理!
📚 如需进一步了解 Azure Speech 与 OpenAI 服务部署,参考官方文档。
为了运行并调试 AI Sales Avatar 的语音交互系统,需要在本地准备好 TEN Agent 的开发环境。
🔧 所需工具与安装方式一览:
工具 | 功能说明 | 安装方式 |
---|---|---|
Docker | 运行 TEN 的容器环境 | 官网下载安装 Docker Desktop |
Git | 克隆并管理 TEN 的代码仓库 | brew install git |
Node.js | 运行前端代码(Playground) | brew install node |
💡 Docker 是 TEN 平台的核心运行环境,所有模块都将以容器形式部署。
.dmg
安装包,并完成安装。💡 Git 是用来克隆和管理 TEN 框架代码的版本控制工具。
安装命令:brew install git
。
验证安装:git -v
。
💡 Node.js 是运行 TEN 的前端 Playground 所必需的环境。
安装命令:brew install node
。
验证安装:node -v
。
完成 Docker、Git、Node 安装后,下一步就是克隆 TEN Agent 的源代码,并配置 .env 环境变量。
🚀 1. 克隆 TEN Agent 代码仓库 在 Terminal 中执行以下命令:git clone https://github.com/TEN-Framework/TEN-Agent.git
执行后,会在本地创建一个 TEN-Agent 文件夹, 其中包含所有运行所需的代码和配置文件。
👇 如下图所示:
📦 2. 进入项目目录并复制环境变量模板 进入 ai_agents 子目录,并复制环境变量文件:
cd TEN-Agent/ai_agents cp .env.example .env
.env 是 TEN Agent 运行所需的环境变量配置文件, 接下来你需要手动编辑它,输入密钥信息(来自 Dify、Trulience、Azure、Agora)。
👇 示例界面如下:
✍ 3. 编辑 .env
文件,填写以下变量:
请使用文本编辑器(推荐使用 Cursor 或 VS Code)打开并编辑 .env
文件,
在文件末尾添加以下内容(填写你自己的密钥和区域信息):
Agora App ID 和 Certificate AGORA_APP_ID=your_agora_app_id AGORA_APP_CERTIFICATE=your_agora_certificate
Azure 语音识别(STT)参数 AZURE_STT_KEY=your_stt_key AZURE_STT_REGION=your_stt_region
Azure 语音合成(TTS)参数 AZURE_TTS_KEY=your_tts_key AZURE_TTS_REGION=your_tts_region
👇 编辑 .env
文件示意图如下:
在 .env
环境变量配置完成后,下一步是正式启动 TEN Agent 的容器环境。
进入 ai_agents
目录并启动 Docker 容器服务:
cd ai_agents
docker compose up -d
这会启动以下容器服务:
ten_agent_dev:用于开发和运行 Agent
ten_agent_demo:示例 Agent
ten_agent_playground:前端交互页面
👇 项目结构示意图如下:
执行以下命令,进入开发容器:docker exec -it ten_agent_dev bash
进入容器后,执行初始化任务脚本来注册 Agent:task use
👇 项目结构示意图如下:
该命令将自动读取并链接 Agent 的配置文件(如 manifest.json
和 property.json
),并自动安装所需依赖包。
👇 执行过程示意图如下:
✅ 完成 task run
后,在浏览器中访问以下地址以打开前端页面:
👉 [https://localhost:49483]
如果运行成功,你将看到如下界面:
点击页面上方的 「Graph」 选项卡。
在下拉框中选择:
➡️ voice_assistant_intergrated_stt (Auto Start)
,
然后点击右下角的 「Save」 保存配置。
👇 页面示意图如下:
tts_default
)azure_tts
这样就完成了语音合成模块的替换.
👇 Azure TTS 模块替换示意图如下:
我们可以根据数字人的形象需求,自定义她的声音。在 Microsoft 提供的语音服务页面中,列出了所有支持的语音名称。
👉 访问地址。
在本例中,我们选择的是一位英文女声:
🗣️ en-US-AshleyNeural
在 Azure TTS 模块中,请将以下字段填写为:
Azure_synthesis_voice_name=en-US-AshleyNeural
👇 Azure TTS 语音名称设置示意图如下:
llm
模块,选择 「Replace Node with」dify_python
这样即可将 TEN Agent 的大语言模型(LLM)模块,接入 Dify 提供的智能体接口。
👇 操作示意图如下:
2️⃣ 完成替换后,再次右键点击新生成的 dify_python
模块, 点击 「Update Properties」,进入属性设置页面。
👇 设置界面示意图如下:
配置完成后,打开浏览器,访问以下地址,即可进入 TEN Agent 启动界面:
👇 页面示意图如下:
🧠 选择智能体流程图(Graph)
点击右上角的 「Select Graph」,在下拉菜单中选择:
➤ voice_assistant_integrated_stt
勾选 「Enable Trulience Avatar」,并填写以下字段:
填写完成后,点击 「Save changes」 保存设置。
👇 配置界面如下图所示:
🗣️ 启动语音互动,测试数字人是否连通成功
✅ 点击右上角的 「Connect」 按钮,完成最后测试。
如果一切配置正确,将出现以下情景:
🧍 数字人形象自动加载显示
🗣️ 她会用自然语音向你问候,并提问,例如:
“我能为你介绍哪几款豪华车?”
🤖 你可以根据她的回答,验证她是否成功读取并理解了 Dify 知识库的内容。
👇 运行示意图如下:
🎯 恭喜你!你现在已经拥有了完整的 AI Sales Avatar!
✅ 来自 OpenAI / Dify 的聊天大脑
✅ 使用 Azure 的自然语音合成能力(女声)
✅ 拥有 Trulience 的数字人形象
✅ 构建于 TEN 平台 的语音交互能力
🌟 这就是 AI Agent 最核心的完整链路:“听 → 想 → 说 → 演 → 链接”
📚 如需进一步了解,可参考 TEN 官方技术文档:
👉 https://theten.ai/docs/ten_agent/architecture_flow
在目前已搭建的「AI Sales Avatar」基础上,
我们可以依照 AX Architecture 的路径,进一步扩展它在实际业务场景中的能力,
逐步打通:
数据 → 模型 → 代理 → 用户接口 → 全业务生命周期管理 的闭环链路。
结合 Trulience 的 D-Human & Avatar 能力,
将当前数字人部署到公司首页或 Web App,
通过自然语音问答引导访客、收集意图,构建以用户为中心的入口,承接:
Marketing Info
Customer Lifecycle
将 Avatar 与公司内部系统对接,例如:
实现:
销售线索管理
库存查询
合同生成等闭环任务
服务于:
Contract Lifecycle
Asset Lifecycle
你可以进一步将 Agent PF(平台)能力模块化,
嵌入不同 BU 的 Data Lake 与工作流管理平台,
实现以下多业务融合扩展场景:
最终推动企业整体的 AI 转型升级。
我始终相信,AI 不应只是冰冷和强大的工具,
它更可以是人类温暖的伙伴,是个体能力的延伸与放大器。
未来,也许会有越来越多像 “Vendy” 这样的数字伙伴,在世界各地悄然诞生——
她们倾听、思考、回应、表达,用技术的力量,守护人的尊严与创造力。
📣 若您也愿意加入这场全球共创的旅程,
欢迎携手探索与分享,让每一位个体都有机会与 AI 一同成长,
共同探索 “一以当千、不落一人” 的 AX 新时代。
谨以此文作为一次小小的尝试与记录,
愿它化作一颗微小的种子,
在人与 AI 和谐共生的未来中,悄然生根、缓缓发芽。