大模型挑选指南来了!涵盖六种情况下的选择方案,为你匹配最佳模型

人工智能
今年年中最好的系统,学习曲线(learning-curve)是所有系统中最低的。只需输入”thing-you-want-to-see —v 5.2”(末尾的—v 5.2很重要,使用最新的模型),就能得到非常不错的结果。Midjourney需要使用Discord(使用指南见文末)。

最近Claude 2亮相、谷歌Bard支持中文、Open AI推出Code Interpreter(代码解释器)……

大模型发布一波接着一波,但五花八门,没有一个可解决所有问题。

所以不同任务到底该用哪一个?

图片图片

别着急,这不来自宾夕法尼亚大学沃顿商学院的Ethan Mollick教授整理了一份挑选指南。

选择困难症“患者”这下有救了!

这份指南不仅涵盖了截至今年夏季的最新情况,而且在不同的任务中,还附上了不同大模型的表现对比。

手把手教你在六个使用场景下挑选大模型,还有最佳免费选项、付费选项。

网友看到后表示:

先替我同事收藏了。

图片图片

一起来康康这份挑选指南里都有啥。

用不同大模型来做这六件事

一、撰写文字

最佳免费选项:Bing 、Claude 2 

付费选项:ChatGPT 4.0、ChatGPT+插件

AI写作这一块,Ethan Mollick教授认为,GPT-4目前仍是最靠谱的工具。

家人们还可以选择用免费的Bing(创意模式creative mode),Claude也是一个不错的选择。

具体来说,用大模型可以帮你做这些事:打草稿、优化写作内容、协助完成任务、解锁自己(AI可以给你提供一种克服困难的方式)。

此外,这些工具还被整合到了一些办公应用程序中,比如Microsoft Office+GPT、Google Docs+Bard。

图片图片

上面这些大模型在文字写作方面的表现都不错,但也都有可能产生“幻觉”,胡言乱语。特别是要求未联网的大模型提供互联网的参考、引用信息。

Bing相较而言产生的“幻觉”更少,因为GPT-4表现效果通常更好,而且Bing连接网络可以真正获取相关事实信息。

Ethan Mollick教授在此前的使用中还发现一个问题:

AI并不能解释自己,它只是让你以为它在解释。

图片图片

如果你要求它解释为什么写了某个东西,它会给你一个看似合理但完全是捏造的答案。当你询问它的思考过程时,它并不是在真正审问自己的行为,只是生成一些听起来像是在这样做的文本。

二、制作图像

最透明的选项:Adobe Firefly

开源选项:Stable Diffusion

最佳免费选项:Bing、Bing Image Creator(使用DALL-E),Playground(可以使用多个模型)

最高质量的图像:Midjourney

目前主要的图像生成工具包括:

  • Stable Diffusion:已开源,特别适合与其它来源的图像结合使用(使用指南见文末)。
  • DALL-E:来自OpenAI,已整合到Bing(需用创意模式)和Bing Image Creator(Bing图像生成器)中。DALL-E很可靠,但比Midjourney差一些。
  • Midjourney:今年年中最好的系统,学习曲线(learning-curve)是所有系统中最低的。只需输入”thing-you-want-to-see —v 5.2”(末尾的—v 5.2很重要,使用最新的模型),就能得到非常不错的结果。Midjourney需要使用Discord(使用指南见文末)。
  • Adobe Firefly:集成在Adobe产品中的,但在生成图片质量方面不如DALL-E和Midjourney。Adobe称他们在训大模型时,只使用有使用权的图像。

大模型各自的表现是这样婶儿的(每张图都是同样提示下不同模型生成的第一张图)

图片图片


图片
△Prompt: “Fashion photoshoot of sneakers inspired by Van Gogh”

需要注意的是,受训练数据影响,这些模型难免存在一些偏见。

其次,训练数据大多来自互联网,缺乏透明度,图像的版权问题不够明确。

此外,目前图片生成中不能真正创作文本,只能生成一堆看起来像文本的东西。但Midjourney对手部的描绘很好。

三、构思创意

最佳免费选项:Bing

付费选项:ChatGPT 4.0(但由于Bing联网,表现可能更好)

要有好的创意,通常需要有大量的想法,而AI正是擅长产生大量的想法。

在创意模式下,可以用Bing查找你喜欢的非常规创意生成技巧,例如布莱恩·伊诺的倾斜策略(oblique strategies)或马歇尔·麦克卢汉的四元结构(tetrads),然后进行应用,或者要求模型提供一些奇怪的想法。

图片图片

四、制作视频

最佳动画工具:D-iD(用于在视频中为面部添加动画效果)、Runway v2(用于通过文本创建视频)

最佳声音克隆:ElevenLabs

现在,AI生成视频方面可以来个一条龙服务:

从生成的角色,到剧本创建,再到配音,都可以交给AI来完成。

用AI工具生成的视频有时看起来还蛮逼真。Ethan Mollick教授就拿自己的照片做过一段“假视频”:

图片图片

但需要特别注意的是,这些工具都需要合乎道德地使用。

五、处理文件和数据

数据(以及使用代码的任何奇怪想法):Code Interpreter

文档:Claude 2(大型文档或同时处理多个文档),Bing(侧边栏适用于较小的文档和网页)

Code Interpreter可实现对上传的文件进行编写并运行代码,生成结果也可供下载。你可以用它来执行程序,进行数据分析,或者创建各种文件、网页,甚至游戏。

Ethan Mollick教授还设置了一个用Code Interpreter来处理数据可视化的方法(链接见文末)

图片图片

处理PDF文档这方面,还是要Claude 2出马。

Ethan Mollick教授表示曾将整本书粘贴到Claude中,还给过它许多复杂的学术文章,并要求它总结结果,Claude的表现都不错。

图片图片

不仅如此,还可以通过继续提问进一步探讨资料,比如说这种方法的证据是什么?作者的结论是什么……

但有时候模型还是会产生“幻觉”,这一点还是要注意。

六、获取信息并学习知识

最佳免费选择:Bing

付费选项:对于儿童来说,可用Khanmigo(AI辅导)

Ethan Mollick教授认为最好不要把这些大模型当作搜索引擎来用,出现“幻觉”的风险很高。

而他建议使用Bing,也是因为Bing联网,“幻觉”会相对来说少一点。但如果谨慎使用,AI通常可以提供比搜索更有用的答案,特别是在搜索引擎给的结果不是很好的情况下。

此外,用这些AI工具来帮助我们学习是个不错的选择。Ethan Mollick教授还给出了一个他认为比较好的“自动导师”提示:

图片图片

传送门:
[1]https://www.jonstokes.com/p/stable-diffusion-20-and-21-an-overview(Stable Diffusion使用指南)[2]https://www.pcworld.com/article/540080/how-to-use-discord-a-beginners-guide.html(Discord使用指南)
[3]https://huggingface.co/spaces/society-ethics/DiffusionBiasExplorer(观察图片生成偏见)*
[4]https://www.oneusefulthing.org/p/a-quick-and-sobering-guide-to-cloning(Ethan Mollick用照片生成视频)[5]https://chat.openai.com/share/afe54a2d-0ad0-4166-b1aa-9a5394deff66(用Code Interpreter做数据可视化)
[6]https://chat.openai.com/share/ec1018ec-1d86-4160-b587-354253c7d5cb(AI导师提示)*

参考链接:
[1] https://www.oneusefulthing.org/p/how-to-use-ai-to-do-stuff-an-opinionated

[2]https://twitter.com/emollick/status/1680586569617481728?s=20

责任编辑:武晓燕 来源: 量子位
相关推荐

2023-09-01 21:12:13

GPT3.5模型微调

2023-04-04 08:00:00

LazyPredic机器学习ML模型

2023-11-22 11:29:28

2022-12-06 10:39:43

Spring事务失效

2023-08-10 14:12:41

CIOIT顾问

2022-08-24 15:08:19

模型数据技术

2023-11-14 18:07:44

Python字典项目

2010-04-25 21:58:24

NTFS权限

2019-01-17 10:58:52

JS异步编程前端

2023-08-26 20:51:25

Python函数代码

2016-07-08 15:02:47

云计算

2023-09-01 15:43:10

2021-03-05 13:08:56

MySQL数据库命令

2022-05-24 10:43:02

延时消息分布式MQ

2023-08-02 10:03:06

ChatGPTCIO

2024-03-14 12:17:00

数据库数据模型

2022-11-29 07:14:56

NLP语言模型

2021-05-06 08:00:00

人工智能神经网络深度学习

2018-08-03 16:40:06

前端前端框架微服务
点赞
收藏

51CTO技术栈公众号