华为终端BG李小龙曝出业界翻车难题:手机拍摄的模糊文字,用AI增强很容易翻车 原创
编辑 | 言征
出品 | 51CTO技术栈(微信号:blog51cto)
近日,华为终端BG李小龙发博展示了Mate70 Pro+的AI照片增强的功能,并热心询问大家对于AI云增强效果是否满意。
图片
为了方便大家查看效果,大家可以点击下面的大图来查看AI增强效果。
左侧是原图,右侧是AI增强图
左侧是原图,右侧是AI增强图
不过一位好奇的网友在评论区问了一个让李小龙非常关注的问题:小龙总,高倍率看不清楚的字能AI(增强)吗,最好要自然点,不能弄成假的。
图片
李小龙回复:文字用AI增强太容易翻车了,当前还属于业界难题。
图片
1.AI云增强是什么
先来回顾科普下这里的华为AI云增强是什么?
这就要首先提一下AI云相机功能,这项功能是华为在2023年10月推出的,
当时余承东给了一个形象的例子——
“以前大家在拍集体大合影的时候,会发现很难做到图像放大后所有人的面貌细节都清晰可见。华为Mate60 Pro、 华为MateX5等手机在拍照上全新推出令人震撼的AI云增强功能,通过云端的亿级参数大模型算法,捕捉并恢复隐藏在图像中的微小细节,带来更清晰细腻的人像体验。
无论是50人的大合影还是单人照,人像肤质都更加透亮细腻,人人都是主角。即使把照片放大,二次裁剪构图,细节依然非常清晰。欢迎大家升级体验!”
图片
刚过去的2024年,11月底华为发布了Mate70系列,在影像技术继续甩出了升级大招:Mate 70系列影像摄影在业界首次搭载了“红枫原色摄像传感器”,让画面呈现更加丰富的层次感和真实感,也带来了AI云相机功能的史诗级增强——长焦云端大模型。
自然,史上最强Mate旗舰Mate70系列也在AI云增强功能上做了创新,针对长焦10x及以上的任意拍摄场景(不在仅限于人物合照),Al 云增强可以智能提升照片清晰度,立显高清质感。
华为官网如是介绍该功能,AI 云增强功能可智能分析用户拍摄的照片,基于云端的亿级参数大模型算法,捕捉并恢复隐藏在图像中的微小细节,提升照片清晰度。该功能支持:
- 拍照模式和人像模式下拍摄的人像照片、花卉照片、宠物照片(支持 20X 以下)。
- 微距模式下拍摄的照片:在相机拍照模式下,近距离拍摄物体自动进入微距,或在相机【更多】页面中选择超级微距模式,拍摄 20cm 以内物体。
- 支持拍照模式下 10X 及以上任意场景的照片(月亮模式拍摄的照片除外)。
目前 AI 云增强功能支持的手机设备情况如下:
- 人像照片:Mate70 系列、Mate X6、Mate XT、Pura 70 系列、 Mate 60 系列、Mate X5、Pocket 2 和 nova 12 Ultra
- 花卉及微距照片:Mate XT、Pura 70 系列和 Mate 70 系列
- 宠物照片、10X 及以上任意场景照片:Mate 70 系列
AI在照片上生成文字为什么这么难?
诚如李小龙所说,目前不要说高倍率模糊文字AI修复,即便让AI在现成图片上添加文字,都很难正确做到。
为什么呢?
首先,目前市面上用于图片生成或照片修复的AI工具在训练过程中,并未专门针对语言文字的复杂性和精确性进行深入学习。因此,当AI图片工具面对生成文字的任务时,它自然不能很好完成任务。
其次,就是用于AI文字生成的训练数据严重不足。在AI训练过程中,并未接触到足够的文字样本的“标签”,由于它的基础语料中没有相应文字的精确“标签”,或者训练者在训练时有意避开了包含文字的图像,以防止生成不恰当的内容或侵犯版权,这都会导致他的基础数据不足。
另外,还有语义理解上的难题。文字的生成涉及到对自然语言的深入理解,这也是一个相对复杂的问题。
图片
当然李老师所提的则是让AI修复高倍率照片中模糊文字的问题,李老师回复:容易翻车,那就说明华为应该已经在研究这方面的内容,期待华为的新成果!
参考链接:
https://zhuanlan.zhihu.com/p/10160709558
https://www.zhihu.com/question/628375704/answer/3343109727
本文转载自51CTO技术栈,作者:言征