华为终端BG李小龙曝出业界翻车难题:手机拍摄的模糊文字,用AI增强很容易翻车

原创 精选
人工智能
刚过去的2024年,11月底华为发布了Mate70系列,在影像技术继续甩出了升级大招:Mate 70系列影像摄影在业界首次搭载了“红枫原色摄像传感器”,让画面呈现更加丰富的层次感和真实感,也带来了AI云相机功能的史诗级增强——长焦云端大模型。

编辑 | 言征

近日,华为终端BG李小龙发博展示了Mate70 Pro+的AI照片增强的功能,并热心询问大家对于AI云增强效果是否满意。

图片图片

为了方便大家查看效果,大家可以点击下面的大图来查看AI增强效果。

左侧是原图,右侧是AI增强图左侧是原图,右侧是AI增强图

左侧是原图,右侧是AI增强图左侧是原图,右侧是AI增强图

不过一位好奇的网友在评论区问了一个让李小龙非常关注的问题:小龙总,高倍率看不清楚的字能AI(增强)吗,最好要自然点,不能弄成假的。

图片图片

李小龙回复:文字用AI增强太容易翻车了,当前还属于业界难题。

图片图片

1.AI云增强是什么

先来回顾科普下这里的华为AI云增强是什么?

这就要首先提一下AI云相机功能,这项功能是华为在2023年10月推出的,

当时余承东给了一个形象的例子——

“以前大家在拍集体大合影的时候,会发现很难做到图像放大后所有人的面貌细节都清晰可见。华为Mate60 Pro、 华为MateX5等手机在拍照上全新推出令人震撼的AI云增强功能,通过云端的亿级参数大模型算法,捕捉并恢复隐藏在图像中的微小细节,带来更清晰细腻的人像体验。

无论是50人的大合影还是单人照,人像肤质都更加透亮细腻,人人都是主角。即使把照片放大,二次裁剪构图,细节依然非常清晰。欢迎大家升级体验!”

图片图片

刚过去的2024年,11月底华为发布了Mate70系列,在影像技术继续甩出了升级大招:Mate 70系列影像摄影在业界首次搭载了“红枫原色摄像传感器”,让画面呈现更加丰富的层次感和真实感,也带来了AI云相机功能的史诗级增强——长焦云端大模型。

自然,史上最强Mate旗舰Mate70系列也在AI云增强功能上做了创新,针对长焦10x及以上的任意拍摄场景(不在仅限于人物合照),Al 云增强可以智能提升照片清晰度,立显高清质感。

华为官网如是介绍该功能,AI 云增强功能可智能分析用户拍摄的照片,基于云端的亿级参数大模型算法,捕捉并恢复隐藏在图像中的微小细节,提升照片清晰度。该功能支持:

  • 拍照模式和人像模式下拍摄的人像照片、花卉照片、宠物照片(支持 20X 以下)。
  • 微距模式下拍摄的照片:在相机拍照模式下,近距离拍摄物体自动进入微距,或在相机【更多】页面中选择超级微距模式,拍摄 20cm 以内物体
  • 支持拍照模式下 10X 及以上任意场景的照片(月亮模式拍摄的照片除外)。

目前 AI 云增强功能支持的手机设备情况如下:

  • 人像照片:Mate70 系列、Mate X6、Mate XT、Pura 70 系列、 Mate 60 系列、Mate X5、Pocket 2 和 nova 12 Ultra
  • 花卉及微距照片:Mate XT、Pura 70 系列和 Mate 70 系列
  • 宠物照片、10X 及以上任意场景照片:Mate 70 系列

AI在照片上生成文字为什么这么难?

诚如李小龙所说,目前不要说高倍率模糊文字AI修复,即便让AI在现成图片上添加文字,都很难正确做到。

为什么呢?

首先,目前市面上用于图片生成或照片修复的AI工具在训练过程中,并未专门针对语言文字的复杂性和精确性进行深入学习。因此,当AI图片工具面对生成文字的任务时,它自然不能很好完成任务。

其次,就是用于AI文字生成的训练数据严重不足。在AI训练过程中,并未接触到足够的文字样本的“标签”,由于它的基础语料中没有相应文字的精确“标签”,或者训练者在训练时有意避开了包含文字的图像,以防止生成不恰当的内容或侵犯版权,这都会导致他的基础数据不足。

另外,还有语义理解上的难题。文字的生成涉及到对自然语言的深入理解,这也是一个相对复杂的问题。

图片图片

当然李老师所提的则是让AI修复高倍率照片中模糊文字的问题,李老师回复:容易翻车,那就说明华为应该已经在研究这方面的内容,期待华为的新成果!

参考链接:

https://zhuanlan.zhihu.com/p/10160709558

https://www.zhihu.com/question/628375704/answer/3343109727

想了解更多AIGC的内容,请访问:

51CTO AI.x社区

https://www.51cto.com/aigc/

责任编辑:武晓燕 来源: 51CTO技术栈
相关推荐

2018-11-02 16:46:54

AI人工智能AI翻译

2023-06-06 17:48:35

罢工人工智能AI

2024-03-07 12:46:39

2017-10-18 13:28:27

语言Python开发错误

2020-12-08 09:06:44

AI机器人聊天

2023-02-09 16:35:45

2024-09-11 13:58:18

2021-09-23 22:24:03

手机参数误区

2023-08-09 17:47:40

黄仁勋计算机NVIDIA

2024-04-15 07:30:00

2024-02-27 10:42:04

开发代码测试

2020-06-29 19:04:01

iOS 14Bug苹果

2021-12-10 08:17:48

字符串拼接场景

2019-12-26 12:11:50

安全主管网络安全CISO

2021-01-22 15:27:22

5nm芯片芯片制程厂商

2020-12-14 09:22:55

AI 数据人工智能

2024-04-25 16:15:09

2020-02-11 21:30:05

Windows 7Windows 10微软

2019-01-16 09:20:42

架构设计JVM FullGC宕机事故

2021-08-27 23:22:30

5G4G手机
点赞
收藏

51CTO技术栈公众号