近期,圈里很多朋友,都尝试利用 DeepSeek 构建自己的智能体。我也利用腾讯元器,将个人公众号内容做了个智能体,可以实现简单的问答。那么延展来看,智能体除了可利用公众号内容,也可使用离线文件等方式来构建。这不禁让我考虑,是否可用这样方式构造一个数据库智能体。说干就干,花了一个小时,构建一个国产库的智能体,玩玩还不错。这里也希望,我们国产数据库的厂商,能更多专注这种新的内容分享方式,加快推进国产数据库的普及。下面我就将构建步骤,分四步来说明下。
1. 什么是“腾讯元器”
在开始之前,我们先了解下什么是“腾讯元器”。腾讯元器(https://yuanqi.tencent.com),是腾讯混元大模型团队推出的智能体创作工具,方便您通过添加提示词设定、插件、知识库等功能捏出自己喜欢的智能体。
你自己创建的智能体,可以发布出来供大家使用,也可以私有来使用。目前已经有大量定义好的智能体,方便大家来使用。我自己也定义了几个智能体,大家也可以搜索使用。
2. 专有智能体构建
智能体的创建,可分为几个步骤,全程可通过简单填写表单即可完成。后面大致说明下我的操作步骤。
(1)准备知识库材料
目前元器创建智能体,支持多种构建知识库的方式。如果是公众号文章就比较简单,开通授权即可;如果是问答对类型,则需要构建一个表格实现问答描述;最为通用则是文本类型,这里就需要准备一系列文档。
目前支持的文本类型,包括PDF、WORD、TXT等,这里就需要将构建下这些文件。目前国内数据库厂商大多提供了在线文档的功能,这里通过自己写的一个小爬虫将文档下载并转储成PDF。在实现上完全可以利用 DeepSeek 直接生成代码,微调后即可使用。以达梦数据库为例,官方文档位于 https://eco.dameng.com/document/dm/zh-cn/pm,以此为基础将其文档都下载下来。
(2)创建知识库
创建知识库比较简单,只需要将文件上传即可。这里要注意,文档上传后需要有个处理过程,根据文档数量及大小有关系,可耐心等待一会。其具体的进度,可以在知识库列表页面中查看到。
(3)创建智能体
有了知识库后,就可以创建智能体。分为两个部分,一是基础是设定部分,这里主要是提示词的部分,比较方便的是,元器提供了提示器的自动生成,稍加修改即可。
在高级设定部分,主要完成模型设置和知识库配置即可。这里需注意选择模型,可以有腾讯混元模型或DeepSeek的选择,知识库部分关联到刚才创建的知识库即可。
当然还有些更为复杂的配置,如可以调用插件和工作流。系统已内置了不少插件,可供使用;也预制了部分工作流的示例,可直接复制参考使用。
(4)发布智能体
最后一步,发布智能体即可。发布后,就可以通过多种方式使用。
3. 效果体验及展望
针对构造的智能体,我们简单体验下效果:
从上面效果可见,智能体已经可以承担一些简单的问答类工作。可以方便用户,快速去了解一个产品;也能弥补只有官方文档造成的入手慢、门槛高的问题。国产数据库之前常常被人诟病的问题,就是文档差、内容旧,问答智能体的出现可以在一定程度上解决这些问题。当然功能远不限于此,如未来提供更为丰富的插件和工作流定义,完全可以开发更为复杂的功能。未来随着智能体的发展,相信会有更多、更垂直的智能体出现,场景也不仅仅限于知识问答类的,例如针对信创场景下创建个“信创智能体”,依托于构建自各厂商产品的知识体,通过工作流分辨用户需求,可实现包括产品选型、架构对比、设计开发、语句优化等常见问题的解决。