文生图模型又卷起来了，Stable Diffusion凉凉，Midjourney流量被反超

发布于 2024-4-2 12:30

浏览

0收藏

今年以来，文生图模型领域就没消停过。

3月23日，Stability AI CEO Emad Mostaque宣布离职，这个昔日文生图巨头CEO的高调退场给了AI界一次小小的震撼。这并不奇怪。混乱，几乎是Stability AI在过去一年多时间里的缩影：管理层离职、技术团队跑路、入不敷出、法律官司……

一年以前，Stability AI还曾是一家文生图领域的超级明星：当Stable Diffusion推出并宣布彻底开源后，这款AI图像生成模型在上线三个月内用户总量达到1000万。同一时期，DALL-E只有150万用户，Midjourney在200万到300万之间。

变化不仅发生在Stability AI，也发生在Midjourney上。今年1月，Lenardo.ai以18.71M的月访问量首次超越持续霸榜的Midjourney，到了2月，两者差距还在进一步拉大。这意味着，作为文生图领域老大的Midjourney正在面临激烈的竞争。

Stability AI、Midjourney的变化似乎也说明一家事情：与ChatGPT稳定领跑通用型聊天产品不同，垂直AI应用的“王位易主”显然更加容易。

开源与赚钱无法兼得，Stability AI跌落神坛

AI独角兽Stability AI的坠落并非一夕之变。早在2023年，该公司就有一批管理层和核心技术成员离开团队。

2023年6月，Stability AI首席信息官Daniel Jeffries、工程副总裁Scott Draves和首席运营官Ren Ito都选择了离职。7月中旬，参与了Stability AI大语言模型开发工作的Louis Castricato宣布离职加入EleutherAI。

就在Emad Mostaque离任的前一周，Midjourney就因数据盗窃把Stability AI的员工都拉入了黑名单。《福布斯》报道，亚马逊网络服务（AWS）因StabilityAI迟迟不支付账单，可能会中断服务。也有消息称，Stability AI已经难以支付员工的工资了。

为什么Stability AI会陷入这样的困境？不赚钱，是一个很现实的原因。

文生图模型又卷起来了，Stable Diffusion凉凉，Midjourney流量被反超-AI.x社区

Stability AI年收入

现在Stability AI的收入主要分为两大板块，一个是to B的AI模型定制化服务和AI技术咨询，一个是to C的Stable Diffusion产品的会员制付费订阅。

从数据看，Stability AI的收入一直呈增长趋势，由2021年的210万美元到2022年420万美元，2023年甚至达到了4420万。

但这样的收入并不足以支撑Stability AI庞大的研发投入。据彭博社报道，截止2023年10月，StabilityAI每月支出在800万美元，也就是说，Stability AI2023年全年的支出在9600万美元左右，将近全年收入4420万的两倍。

即使对比同行，Stability AI的商业化业绩也不够理想。凭借会员订阅制的文生图模型Midjourney在2023年年度收入预估在3亿美元，大约是StablityAI的6倍。这与两者的用户规模形成了鲜明的对比。截至2023年11月，Midjourney已经拥有超过1640万活跃用户，而Stable Diffusion 在所有渠道的日活跃用户大约在1000万。

Stability AI商业化困难的原因主要有三点：

一是开源路线导致商业化路径不清晰。Stable Diffusion主打开源，用户可以自己基于开源代码搭建服务，未必非要依赖Stability AI，这也使公司锁定客户、自主定价变得艰难。相比之下，Midjourney这样的闭源AI图像生成产品有着简单清晰的商业化思路，用户花钱生成图片。
二是使用门槛更高。使用Stable Diffusion，需要编程知识和4GB独立显卡，技术门槛更高，对小白很不友好。作为对比，Midjourney上手就很简单了，只需要注册Discord账号，简单操作就可以得到精美高质量的图片，这可能也是大部分用户不惜花60美元支付费用的原因。
三是商业化节点滞后。比起Midjourney从一开始就主打会员付费制，Stable Diffusion的商业化的道路姗姗来迟。在Mostaque的构想里，开源模型的商业模式就是面向企业提供解决方案，即类似红帽和MongoDB，在开源版本免费的同时，通过定制化商业版本盈利。但显然，Mostaque低估了这一商业化路线的难度。

在自身商业化迟迟打不开局面的情况下，越来越多的巨头开始涌入文生图模型。比如，Meta推出了mu Edit和Video，谷歌旗下Imagen也自带了安卓系统3亿的潜在客户。亚马逊的图像生成模型——Titan Image Generator已经可供 Bedrock 上的AWS客户使用。

内忧外患之下，Stability AI的CEO和员工集体跑路就都不难理解了。

行业老大换人了！Midjourney流量被Leonardo.ai赶超

那边是曾经的扛把子倒了，这边现在行业老大Midjourney的流量也被Leonardo.ai反超了。

今年1月，一款主打 AI图片合成的Leonardo.ai网站流量以18.71M的月访问量首次超越了霸榜第一的Midjourney，并在之后一直呈赶超趋势。

文生图模型又卷起来了，Stable Diffusion凉凉，Midjourney流量被反超-AI.x社区

从平均访问停留时间来看，Leonardo ai也以12min的平均用时超越了Midhourney的10min，Leonardo ai在三个月内的用户粘性更强。

文生图模型又卷起来了，Stable Diffusion凉凉，Midjourney流量被反超-AI.x社区

就2024年2月网站流量的各指标对比看，Leonardo ai的月访问量和独立访客的平均访问次数均已超过Midjourney。

文生图模型又卷起来了，Stable Diffusion凉凉，Midjourney流量被反超-AI.x社区

有趣的是，Leonardo AI的底层模型就是用Stable Diffusion微调的。不过与Stable Diffusion需要Python基础和独立显卡不同，Leonardo. ai在网页端就可以免费使用。

文生图模型又卷起来了，Stable Diffusion凉凉，Midjourney流量被反超-AI.x社区

与Midjourney相比，Leonardo. ai的优势主要体现在性价比。

现在Midjourney基础版需要10美元一月，每月仅生成 200 张图像。而Leonardo. ai的免费版每月可以生成4,500 张图像（每天150张）。此外，Leonardo. ai还提供每月10美元的年度计划，用户每月最多可以生成 8500 张图像。这样的定价显然对对小白和学生党更加友好，所以有很多博主将其称为“Midjourney平替”。

从产品能力上说，Leonardo. ai与Midjourney各有侧重，但前者支持用户自定义模型，让其绘画风格上有了更多的延展性。

具体来说，Leonardo ai偏向写实，Midjourney生成图像更加梦幻、抽象，只能输入文字版prompt，偏向艺术。

从对输入指令的还原度讲，Leonardo. ai能够根据内容生成还原度较高的图片，更加逼真写实，就像是日常拍出的照片。但是，Midjourney更加艺术、偏向油画质地。

对于更喜欢写实风格的受众，Leonardo. ai是一个更好的选择，也就是说，Leonardo ai的应用场景更加广泛，可以应用于商务、艺术、游戏、写实。而Midjourney更偏向于艺术路线，生成图像更加梦幻、色彩更丰富、质地更细腻。

比如，下图中的两位老太太，Midjourney生成图像偏向抽象类油画类艺术创作，Leonardo生成的图像在自然光线下更加真实。

文生图模型又卷起来了，Stable Diffusion凉凉，Midjourney流量被反超-AI.x社区

除了艺术、商务、写实等更加广泛的应用场景，Leonardo. ai还支持用户自定义自己的数据和训练模型，同时有绘画、素描、插图等不同的成图风格供用户选择。在生成图像的过程中，用户可使用参数和选项调整图像，塑造风格、情绪等，也能根据需要调整分辨率、格式和质量。此外，用户还可以将自定义的模型分享给其他用户。

而Midjourney目前仅支持用户输入指令，无法调整参数、分辨率、格式等。这就极大限制了 Midjourney出图的稳定性。对很多用户来说，Midjourney出图的质量尽管很高，但是随机性太强，有时候符合自己的需求，有时候不符合，就像抽盲盒一样。

性价比又高，又能能自定义模型，“Midjourney平替”取代Midjourney自然也合情合理。

行业座次变化背后，是用户需求的精细化

自生成式AI故事兴起以来，竞争一直是这个行业绕不开的话题。

但少有人注意到，不同于Chat GPT等通用AI助手已经形成的稳固格局，自2022年3月Midjourney发布开启AI作图以来，短短两年时间内，文生图模型垂直赛道就已经发生了巨变：

2022年8月，Stable Diffusion以三个月用户量增长1000万称霸市场；到后来，Midjourney通过产品迭代，在相当长时间内流量高居行业第一；到现在，Stable Diffusion陨落、Midjourney流量被Leonardo. ai反超。

换句话说，在非通用细分AI赛道里，AI产品的竞争更加激烈、趋于白热化。与通用型AI个人助理不同，文生图模型赛道用户更强调地并非体验性、趣味性和新鲜感。从长远看，用户使用模型的工具导向更强，更加强调操作简易性和出图质量。简而言之，模型生成的图像是否符合输入指令，质量高不高，上手快不快。

一年前，Midjourney因更低的技术门槛、更细腻的图像质量打败开源模型Stable Diffusion，赢得了更加广阔的用户市场。而现在，横空出世的Leonardo则凭借“模型定制化”与更细微的参数调整与Midjourney打成平手。而且，Leonardo. ai独立访客的平均访问次数和平均访问停留时间都超越了Midjourney，这意味着Leonardo. ai的用户留存能力更高，用户粘性更强。‍

在文生图领域产品竞争、迭代的背后，我们看到的是，愈发精细化、差异化的用户需求。从模型生成到成图质量到精细化的定制需求，人们不再满足于对AIGC热潮和技术光环的追捧，更加强调性能和使用体验。这也符合在2024年AI赛道更加细分、从模型建设涌入C端应用开发的总体趋势。

在未来，谁能胜出，谁会淘汰，都不再是棋盘上的既定数。与时俱进，从用户角度不断优化性能打造精细化、差异化的产品体验才是AI公司最后的护城河。

本文转载自钛媒体

标签

Stability AI

51CTO

51CTO博客

51CTO学堂

文生图模型又卷起来了，Stable Diffusion凉凉，Midjourney流量被反超

开源与赚钱无法兼得，Stability AI跌落神坛

行业老大换人了！Midjourney流量被Leonardo.ai赶超

行业座次变化背后，是用户需求的精细化

目录