美图秀秀上车最新自研大模型,各类AIGC玩法可直接体验

人工智能
作为AI能力的提供方,美图吴欣鸿认为,目前AI视觉大模型在生产端的三个待解决的问题是:垂直领域的极致效果、工作流整合、变现能力。

美图自研大模型3.0,正式发布!

并且全面应用于美图旗下影像与设计产品。

图片图片

这是自美图大模型面世100天后的最新迭代。

相较于最初版本,3.0版能够生成更加真实细腻的画面细节。

图片图片

如上这些生成能力,在美图秀秀上能直接体验。

图片图片

最近正流行的AIGC玩法,在其中都能找到。

图片图片

美图公司创始人、董事长兼CEO吴欣鸿透露,现在美图大部分产品都融入了自研大模型。

除了影像和设计领域,美图自研大模型还将在电商、广告、游戏、动漫、影视五大行业发力。

美图秀秀可直接体验

美图自研大模型名叫MiracleVision(奇想智能)。

其最显著的特点是更懂美学。

美图把长期积累的美学认知融入MiracleVision视觉大模型,并搭建了基于机器学习的美学评估系统,为模型生成结果打上“美学分数”,从而不断地提升模型对美学的理解。

所以美图也将自己的大模型称为是“艺术生和理科生的结合”。

目前MiracleVision3.0的最新能力在美图秀秀上即可体验。

图片图片

而且操作很简单。比如涂鸦生图,寥寥几笔的草图再加上提示词,大模型都能“力挽狂澜”。

图片图片

更加专业、控制更多的体验可以在AI视觉创作工具“WHEE”上体验。

比如“图生图”功能里,可以通过智能联想来生成完善的提示词。

同时也能通过文字控制不希望呈现的内容。

图片图片

更进一步可控制生成图像风格。

图片图片

以及可以通过参数调整、画面控制能让生成图片更加符合自己的预期。

在提升工作流效率方面,美图大模型MiracleVision现在进入了电商、游戏、动漫、广告和影视五大领域。

图片图片

从6月首次面世以来,MiracleVision经历了三次迭代。

  • 1.0版本主要初步构建大模型架构和基础;
  • 2.0版本联合了设计师、艺术院校老师学生共同构建了高质量数据集,使得大模型在美学方面达到更好状态;
  • 3.0版本更强调模型的可控性,在细节和局部控制上做了提升,使得模型在技术层面达到更好效果。

图片图片

目前,美图AI视觉创作工具“WHEE”的AI效果生成数已超过550万张,已初步打造设计师生态;AI口播视频工具“开拍”月活跃用户数已突破35万;桌面端AI视频编辑工具“WinkStudio”已累计服务近10万名视频创作者。

美图吴欣鸿也表示,如今的美图全员拥抱AI。随着AIGC趋势的发生,美图有了更加明确的发展战略。

比如快速推出自研大模型、布局五大行业,这些动作都基于美图对于AIGC趋势的理解和洞察。

上半年投3个亿做研发

最明显的一个方面,是美图对于当下AIGC趋势活跃用户的理解。

吴欣鸿表示,他们观察到如今离AIGC趋势最近的人,不是设计师,而是“传播者”。

以新媒体运营、电商运营和KOL为主的群体。

这部分人群没有专业从业者的“包袱”和高要求,同时又能向下连接更多普通人。美图目前的发力点之一就是抓住这部分人群,逐步开发更加完善的AI工具、构建工作流。

图片图片

同时,美图也认为自身在大模型趋势下具备一个先天优势——可以很快得到用户反馈。

作为一家成立已有15年的产品公司,美图已经构建起了足够庞大的用户群体,能够通过在自身平台上试水新功能,快速得到市场反馈并快速调整效果,这样能让大模型更高效地和实际场景结合起来。

作为AI能力的提供方,美图吴欣鸿认为,目前AI视觉大模型在生产端的三个待解决的问题是:垂直领域的极致效果、工作流整合、变现能力。

一一对应来看,美图在这三方面已开始发力。

其一,美图快速迭代自研大模型,在100天时间里让模型生成效果更加丰富且可控,能在满足用户新鲜体验的基础上,提供更加具有实用价值的图像设计作品。

其二,美图选择了五大方向,面向生产者提供了AI设计工具。据透露,美图选择电商、游戏、动漫、广告和影视这几个行业,主要是看重了它们和互联网行业有更加原生的关系。这使得AI工具能更好融入其工作链路,整合工作流速度更快。

其三,变现能力。美图目前已经构建了一个创作者生态,这部分对AI感兴趣的创作者,可以将自己原创的AI视觉效果做成配方,在美图搭建的平台上售卖。这样一来,创作者能够获得更多收入,同时他们也能起到传播推广的作用,吸引更多人来使用AI视觉创作工具。

基于这些理解,今年美图正式提出了AI产品形态,包括底层、中间层和应用层。

底层为MiracleVision自研大模型。

中间层由美图AI开放平台、美图创意平台、美图AI助手RoboNeo组合而成,分别负责开放共享AI技术、搭建创作者生态、聚合美图影像服务。

应用层由普通用户更熟悉的各类应用APP构成。

三层架构的搭建,根本逻辑还是为产品出发。

以底层研发为例,美图旗下美图影像研究院(MT Lab)早在2010年成立。目前公司大模型研发相关人员为600人左右。

今年上半年公司研发投入2.94亿元,同比增长10.8%。

美图坦言做研发是遵循更务实的逻辑,也就是看最终在用户和收入增长方面,是否能带来实际增长。而且这一切都自然都能通过实际业绩来证明。

今年上半年,美图公司实现总收入12.61亿元,同比增长29.8%。月活跃用户数达2.47亿,同比增长2.5%。VIP会员数超720万,创下历史新高。以VIP订阅为主的影像与设计产品业务收入6.02亿元,同比增长62.2%;美业解决方案业务收入2.86亿元,同比增长31.1%;广告业务收入3.49亿元,同比增长28.2%;其他业务收入2309万元。

不过回到当下,美图也坦言视觉大模型应用还正处在探索期。当下很多应用开发都是齐头并进,各家也都在摸索路径。

在吴欣鸿看来,视觉大模型应用普及将经历三个阶段:2024年之前为探索期,2024-2025年为高速发展期,2026-2030年为成熟期。

图片图片

而想要成功穿越周期,不仅要有审视趋势的能力,当然还要有真金白银的支撑。

就以当下让厂商们焦虑的算力问题,美图透露目前正在和多家云厂商合作,有充足算力可以使用。

吴欣鸿更进一步补充,美图“很幸运”能快速通过订阅和单购获得回报。

责任编辑:武晓燕 来源: 量子位
相关推荐

2022-04-19 07:45:40

代码Python美图秀秀

2015-11-12 09:49:29

可视化

2020-10-24 11:05:21

AI 技术PS

2013-11-06 14:19:08

2015-08-03 15:43:08

美图联手微软

2024-01-08 16:14:40

美图AIGC运维

2014-09-18 09:20:18

WPS高德地图美图秀秀

2023-12-23 23:16:36

机器人模型

2014-05-27 17:11:01

HNC有线网络无线网络

2011-10-10 14:15:17

OpenWorld甲骨文oracle

2012-10-29 09:16:10

2020-07-28 09:55:20

自拍华为三星

2014-11-21 12:57:55

墨迹天气

2013-07-17 13:57:20

蔡文胜移动互联网
点赞
收藏

51CTO技术栈公众号