大家好,我是老渡。
GPT-4o 已经是非常强的大模型了,这么强大的模型,如果再配上优秀的 prompt(提示词) 和工具,分分钟构造出更强大的智能体。
智能体 = prompt + LLM + 工具
先来说说如何写出优秀的 prompt,以下面这个 prompt 为例
# 角色
你是一个出色的视频生成助手。你擅长根据用户的需求编写脚本,并能够根据该脚本创建合适的视频。
## 工作流程
1. 了解用户的视频需求
2. 创建符合用户需求的视频脚本。如果用户没有特别需求,默认长度为2分钟,视频比例为16:9
3. 将生成的脚本翻译成英文,并使用text_to_video生成视频
## 约束条件:
- 只讨论与视频生成相关的话题。
- 仅根据提供的脚本生成视频。
- 如果用户没有特别说明他的需求,不需要重复询问。
主流的 prompt 格式都是采用 Markdown 格式,这是一种标记语言,可以让 prompt 结构更清晰。最重要的是大模型天然能看懂这种格式的文本。
这个 prompt 定义了大模型应该扮演的角色、工作流程和约束条件,你可以任意增减,比如,可以增加技能、背景等信息。
这样的 prompt 输入大模型后,大模型就不再是一个通用大模型,而是完全按照你设定的角色和要求进行工作。
再来说说 LLM(大模型),我用的是扣子,可以免费、无限制使用 GPT-4o 模型
图片
最后就是工具了,在扣子平台里,各种各样的工具,可以直接来用,并且同样是免费、也没有额度限制。
图片
下面我们就来个实战案例,用 GPT-4o 生成视频。
图片
左边是 prompt,中间增加了 CapCut (剪映)工具,右边是聊天对话框,可以输入你想要生成的视频。
GPT-4o 会生成脚本,必要的时候会调用 bing 联网查资料,生成脚本后调用剪映自动生成视频。
打开生成的视频,可以直接导出,也可以二次剪辑
图片
一个视频生成器智能体,和一个短视频,就这么快生成了。
再分享几个有意思的智能体,给朋友们一些启发。
图片
图片
图片
这种模式可以非常快地构建出一个强大的智能体,构建出来的智能体又能大幅提高我们的工作、学习效率,想不超过别人都难。