Dify Docs home page
简体中文
Search...
⌘K
Ask AI
Blog
Dify
Dify
Search...
Navigation
应用案例
如何训练出专属于“你”的问答机器人?
使用文档
插件开发
访问 API
资源
入门
欢迎使用 Dify
云服务
Dify 社区版
Dify Premium
Dify 教育版
访问 API
手册
接入大模型
构建应用
工作流
知识库
工具
发布
标注
监测
扩展
协同
管理
动手实验室
简介
初级
中级
社区
寻求支持
成为贡献者
为 Dify 文档做出贡献
插件
功能简介
快速开始
插件管理
接口定义
最佳实践
发布插件
常见问题
研发
DifySandbox
模型接入
迁移
阅读更多
应用案例
DeepSeek 与 Dify 集成指南:打造具备多轮思考的 AI 应用
私有化部署 Ollama + DeepSeek + Dify,构建你的专属私人 AI 助手
如何训练出专属于“你”的问答机器人?
教你十几分钟不用代码创建 Midjourney 提示词机器人
构建一个 Notion AI 助手
在 Dify 云端构建 AI Thesis Slack Bot
将 Dify 快速接入 QQ、微信、飞书、钉钉等平台
如何在几分钟内创建一个带有业务数据的官网 AI 智能客服
使用全套开源工具构建 LLM 应用实战:在 Dify 调用 Baichuan 开源模型能力
手把手教你把 Dify 接入微信生态
将 Dify 应用与钉钉机器人集成
使用 Dify 和 Azure Bot Framework 构建 Microsoft Teams 机器人
如何让 LLM 应用提供循序渐进的聊天体验?
如何将 Dify Chatbot 集成至 Wix 网站?
如何连接 AWS Bedrock 知识库?
构建 Dify 应用定时任务助手
如何在 Dify 内体验大模型“竞技场”?以 DeepSeek R1 VS o1 为例
构建 AI 销售数字人
AI 机器人开发:融云 IM 与 Dify 集成实战
扩展阅读
常见问题
政策
开源许可
用户协议
On this page
改变发生
注册并生成应用
准备语料
开始训练
训练成功
应用案例
如何训练出专属于“你”的问答机器人?
Copy page
作者:阿乔
火枪击穿了专属于骑士阶层身披的铠甲与荣耀,武力对等才会有真正的平权。
技术平权的速度从未来得如此之快。
作为兢兢业业的 CODING DevOps 项目的技术文档工程师,在为产品贡献数百篇文档后,依然止不住要在各种用户群 / 技术支持群里为客户解答问题。即使在每条答复中贴上文档链接,依然架不住新用户反复提问。(没办法,DevOps 产品中间又包含多项子产品)
注:CODING DevOps 是腾讯云旗下的一站式研发管理平台及云原生开发工具,旨在让软件研发如同工业生产般简单高效,助力提升企业研发管理效能。
虽然由 ChatGPT 掀起 AI 革命已来,但是它并不能够回答“我的”问题,也不能回答“你的”问题。但它却可以回答“大家”的问题。
为什么?ChatGPT 本身便是由庞大的互联网语料库训练而成,并且这部分训练数据截止于 2021 年 9 月。如果你的产品在这个日期之前就有幸在互联网中占有一席之地,那恭喜你,GPT 可以大概率可以回答出你的产品是大概是干嘛用的。因为它会从你的官网收集已有的描述语料。具体到单独的产品或公司的细节时它便开始靠胡言乱语来敷衍你了。
例如这样 🔽
这里的“胡言乱语”指的是它会用其他不相关的概念进行回答,并且
你并不能够预期什么问题会有什么回答,这在商业场景下十分致命。在大多数情况下,ChatGPT 对于一些带有公理性质
的知识回答是没有问题的,作为一个可以日常侃大山闲聊的对象依然是合格的,可是你却看着它的强大的学习和理解能力望洋兴叹。
“你这个孙悟空什么时候才能懂我,给我想要的回答?”
这也是为什么说它能够回应大家的问题,但是却不能够回答出“我”想要的问题。
改变发生
直到,Dify 横空出世。
你可以简单地将 Dify 理解为是一个能够帮助你进行数据清理和文档训练的地方。咱们也给狗屁通(GPT)补补课,手动给它补上缺失的语料。把它从通用型聊天机器人,变成你的专业问答机器人。是的,从侃大山到对答如流,这中间的鸿沟不是一点半点,需要强大的理解、归纳总结能力。不过这正是狗屁通(GPT)的强项。
注册并生成应用
现在,我们打开 Dify 并注册一个聊天机器人,我们在这里选择“聊天助手”。
填写基础的名称和描述,选择某个 LLM 来提供对话服务。点击发布,Duang,一个聊天机器人就做好了。访问左侧的“监测”,你可以看到这个应用的在线地址。
但是,它现在也只是一个
通用型聊天机器人
,离商业可用的
专用型问答机器人
还差一个语料的距离。
准备语料
Dify 提供了一个名
“知识库”
功能,这里就是我们上传语料的地方。
现在点击“创建知识库”选项,上传你的文本内容。
目前 Dify 仅支持上传单个文件,文件格式支持 TXT、HTML、MarkDown、PDF。
是的没错,你也可以把电子书上传进来,用 AI 帮助你提炼书本内容。
在正式开始训练前,我们得先把教材准备好。好在 CODING 之前的所有文档皆以 Git 代码仓库 + Markdown 的形式进行协作,因此我只需要先把文档先拉到本地中。不过我现在碰到了第一个问题,那就是如何把仓库中的这一系列 .md 文档文件合并至同一个文件中?
不怕,让 AI 给我们写一段 python 吧。
试着运行这个脚本,oh,输入路径后就成功生成了一篇总合文档!如果你想了解如何让 AI 给你写代码,不妨阅读
《如何用狗屁通(GPT )解决一个套娃问题》
。
开始训练
现在要做的事,就是上传这个文件并静待训练成果了。
数据自动分段与清洗完成后,在刚创建的应用设置中的上下文,关联这一篇文档。为了保证响应速度和成本控制,这里直接用 gpt-4o 模型。
训练成功
现在再去和这个机器人互动,看看它会回答什么?
好了,你已经是个成熟的问答机器人了,可以回答更加复杂的产品问题了。
这个问答机器人花了多久做出来,成本如何?
整理语料+训练完成控制在半个小时以内,训练成本 0.27 美元。
现在,AI 可以深入到产品内部,变成妥妥的产品专家。只要有优秀的文档,所有公司都可以打造出专用型问答机器人。
武力对等才会有真正的平权。如果你对我的实践过程同样感兴趣,可以来体验一下我做好的机器人。访问
此地址
。
不妨也来 Dify 平台训练属于你自己的机器人。做一个考试问答机器人?出题机器人?
编辑此页面
|
提交问题
Was this page helpful?
Yes
No
私有化部署 Ollama + DeepSeek + Dify,构建你的专属私人 AI 助手
教你十几分钟不用代码创建 Midjourney 提示词机器人
Assistant
Responses are generated using AI and may contain mistakes.