51CTO读者成长计划社群招募,咨询小助手(微信号:CTOjishuzhan)
文 | Calvin Wankhede
编译 | 王瑞平
其实,技术革命离我们一点也不遥远...
在过去的几个月里,我们目睹了AIGC工具的突然爆发。在免费和付费,开源和专有之间,用户有很多选择。但如果你关注过有关AI生成图像的讨论,你肯定听说过Midjourney与Stable Diffusion之间的竞争。
虽然这两款AI图像生成器都非常出色,但它们在自定义功能、美术风格、易用性、定价等方面存在明显差异。因此,在本文中,我们介绍了如何将二者区分开,以及您应该使用哪一款。
1、快速了解差别
同样是用文字生成图片,Midjourney和Stable Diffusion究竟有什么差别?这里,根据官网信息,也根据自己的经验,我们简单做出总结,希望能够帮助到广大用户朋友。这只是一个大概的总结,更详细的介绍还需要您通读全文。
从技术层面来看,Midjourney使用专有的机器学习模型,而Stable Diffusion的源代码是免费的。只要符合要求,您可以在自己的计算机上下载并运行Stable Diffusion,而Midjourney只能在有网络连接的情况下使用。
此外,访问Midjourney的唯一方法是通过Discord聊天应用程序。而您可以通过各种在线和离线应用程序使用Stable Diffusion。
在付费模式方面,Midjourney每月至少需要花费10美元才能生成有限张图像。您可以在自己的硬件上免费运行Stable Diffusion,也可以为在线服务支付少量费用。
您可以使用Stable Diffusion填充或修改图像的某些部分,中途不支持内涂或外涂。此外,Stable Diffusion还支持数千个可下载的自定义模型,而在Midjourney中,只有少数模型可供选择。
总的来讲,Midjourney似乎更便于用户使用,因为它的设置比Stable Diffusion少。然而,后者提供了许多更高级的功能和定制选项。
继续阅读可以帮助你了解更多Midjourney和Stable Diffusion之间的详细差别。我们还使用了相同的文本提示生成图像并进行了比较。
2、Midjourney更便于使用
Midjourney和Stable Diffusion作为当今最流行的AI图像生成器,都于2022年年中面向用户推出。但在当时,二者被推出的目标是截然不同的,Midjourney是作为一项盈利性服务被推出的,而Stable Diffusion则是开发者发布的开源应用。
Stable Diffusion所具有的开放性质使其成为可定制和被广泛使用的图像生成器之一。你可以在线使用它的基本版本或进行免费与付费订阅。
并且,像Stable Diffusion Web UI这样的前端软件通常包含许多高级功能并允许你使用自定义美术模型。但是,如果你希望获取效果最佳的图像,并希望在自己的计算机上生成图像。Stable Diffusion的缺点是需要设置一些时间和技术技能。
从这一点看来,虽然Midjourney更便于使用,但是Stable Diffusion也为初学者和有经验的用户提供了大量选择。
另一方面,用户更容易学会如何使用Midjourney。官方在Discord聊天应用程序上也公布了使用指南。此外,你还可以在提示中添加一些参数,这些都是可以自定义的。
也就是说,Midjourney的最新V5版本可以生成与文本提示非常匹配的高质量图像。所以,在易用性方面,它具备一些优势。但如果你愿意不断调整输入和设置,Stable Diffusion也可以达到甚至超过Midjourney的图片生成效果。
3、各有利弊
乍一看,Midjourney和Stable Diffusion似乎提供了相同的功能集。然而,仔细比对,你会发现这两种图像生成器各有一些独特的优点和缺点。
以升级为例,从前,你可以使用Midjourney中的U1、U2、U3和U4按钮完成升级。而Midjourney的最新版本不支持任何升级型号。相比之下,Stable Diffusion的开放性允许你下载几个不同的升级模型进行实验。如果你的电脑有足够的内存,你还可以在Midjourney中生成比目前限制的100万像素更高分辨率的图像。
4、功能的差异
Midjourney与Stable Diffusion在功能上具有一系列差异,使生成的图像更符合用户需求:
(1)图像修复与图像扩展:Stable Diffusion具有图像修复(Inpainting)和图像扩展(outpainting)功能。你可以使用图像修复功能调整现有图像的某些部分,而应用图像扩展功能,你可以在现有的图像边界之外生成新的细节。而Midjourney还不支持这两种功能。
(2)图片提示:你可以上传一张(或两张)图片用来提示Midjourney生成图片的风格。机器人程序会将图像与文本结合起来,生成视觉上与输入相似的输出。
(3)自定义美术风格:Midjourney提供了一个动画优化模型,你可以使用niji参数调用。Stable Diffusion可以让你下载用自定义模型训练出的各种艺术风格。
(4)审查:虽然官方的基础Stable Diffusion模型不允许生成明确的图像,但你可以使用自定义模型解决这些限制,这在Midjourney中是不可能实现的。如果你的提示信息中包含明确或暗示性的语言,你的帐户可能会被禁止。
请记住,你必须在自己的硬件设备上使用Stable Diffusion才能充分发挥出它的优势。在线工具不能提供相同程度的灵活性,这使得Midjourney和Stable Diffusion的功能变得一样强大。
5、付费VS开源
作为一家以营利为目的的公司,Midjourney对用户的使用频率设置了一些限制。即使是付费订阅的用户,你每个月也只能获得有限的免费图像生成时间和次数。
而在30美元/月及以上的付费模式中,Midjourney确实为用户提供了无限的放松模式,但这意味着你必须为每个任务等待几分钟。
在付费方面,Stable Diffusion则采取了完全相反的模式。它的源代码可以被下载,这意味着可以免费使用。然而,你需要一台配备专用显卡的功能强大的电脑,需要具有至少4GB的VRAM(影像随机接达记忆器)。
但这种硬件设备至少会花费你一千多美元。幸运的是,如果你喜欢冒险,你还可以尝试在线使用Stable Diffusion,甚至可以在基于云的虚拟机(如,Google Colab)中使用。
值得注意的是,Stable Diffusion的创建者还提供了一个基于网络的图像生成应用程序Dream Studio。这就像Midjourney一样很容易上手,但是也需要付出一定的代价。
即便如此,这个价格对于使用者来讲还是相当便宜的,10美元可以获得1000个积分。你也可以免费试用,所有新账户在注册时都可以免费获得25个积分。
如果你正在寻找一个免费且易于使用的工具,我建议你考虑选择其它的应用,比如,Bing Image Creator。
6、生成图像大比拼
为了比较这两种工具的使用效果,我在Midjourney和Stable Diffusion输入了相同的提示词生成了图像,让我们一起比较一下。
第一组图片是用一个相当简单的提示词生成的:“《星球大战》中的达斯·维德,但要做成赛博朋克”。我认为,即使应用了截然不同的方法,这两个图像生成工具在提供信息方面表现得都很好。
下一个提示词清楚地展示出Midjourney生成图像的最大优点:现实主义。如果你想让生成的图像看起来更真实,Midjourney无疑是首选。虽然Stable Diffusion匹配的提示符中也包含了所有内容,但它并没有达到“逼真”的程度。
最后一个示例中的文本提示要求“一个巨大的白色蛇形龙栖息在岩石上,看着地平线”。Midjourney再一次创造出了更复杂的细节。然而,如果你仔细观察图像的底部,你会注意到Midjourney试图复制它从训练数据中学到的一系列乱码。
高级用户则可以从Stable Diffusion中获取效果更好的图像。然而,Midjourney通常在输入相同的提示下获得更好的结果。
那么,你更喜欢哪个AI图像工具呢?欢迎留言告诉我们!
参考资料:https://www.androidauthority.com/midjourney-vs-stable-diffusion-3327349/