AI新动能: 数字人三大特征八大场景 原创 精华
随着元宇宙概念的火爆也一同带动了数字人市场的快速升温,据计算全球平均每天都会诞生一个数字人。数字人正成为一股潮流,涌入人们的日常生活——会“捉妖”的虚拟美妆达人柳夜熙,抖音出道三天点赞即超百万,一夜之间成为国内虚拟偶像界的“顶流”;在江苏卫视跨年演唱会上,昔日歌后邓丽君“重返”舞台,与歌手周深同台对唱,交织几代人的青春记忆;而在杭州亚运会上,数字人点燃火炬,成为开幕式的亮点。除此之外,数字人担当起手语主播、气象主播、公益宣传、带货达人等各式角色,代替真人提供服务支持……
一、什么是AI数字人?
数字人的核心是“人”,本质上是通过数字技术提高数字人的综合体验,使之带来真人般的感受和互动。
一方面,随着人工智能、虚拟现实、高精度渲染等技术的发展和融合,数字人的拟人化程度愈来愈高,从形象、表情、姿态、动作,再到语音、语意、语态等方方面面正在逐步逼近真人水平。例如,超写实数字人(Metahuman)已成为当前主流,柳夜熙、“邓丽君”等都是超写实数字人的代表,拥有高度逼真的数字化外观形象。
另一方面,人工智能技术在数字人形象生成、动作驱动和语言交互等环节的深入应用,也将进一步提升数字人制作的自动化水平,推动数字人市场从利基走向大众。数字人的拟人化,以及生产制作的自动化程度反映数字人系统整体进化和发展水平,代表着数字技术综合运用能力和成熟度体现。
根据“拟人化”和“自动化”两个维度,我们可以将数字人分成 L1-L5 五个等级,如下图所示。
其中,我们将 L4 和 L5 等级的数字人统称为“AI 数字人”。Ta 们不仅具备高度的拟人化呈现,在形象、动作和智力层面都更接近于真人水平,能够听懂、看懂、有记忆、自学习,与人进行自然交互;同时,在制作流程中也融合了大量的人工智能算法技术来提升数字人的生产效率,降低数字人的制作成本。普遍认为,只有达到 L4 级别及以上的数字人才能真正的走入千行百业,在消费和产业领域大放异彩。
二、AI数字人的三大特征
多模态交互、深度学习和 AIGC是 AI 数字人的三大特征。
首先,在应用层面,多模态交互是 AI 数字人的“核心力”。
我们认为,具备足够自然和拟真的多模态交互能力,是数字人在更广泛的应用场景中逐步替代真人角色的关键。所谓“多模态交互”,即是将深度学习神经网络和计算机图形学相结合,充分模拟人与人之间自然真实的交互方式,实现“听得懂,看得见,说得出”的人机交互效果。
拥有多模态交互能力的 AI 数字人,不仅能够呈现传统语音对话无法展现的多媒体信息,通过结合计算机视觉技术,还能完成身份识别、手势识别、情感识别等多项交互任务,让交互过程更加丰富且高效。与此同时,可视化的写实形象也赋予了 AI 数字人独特的情感温度,有助于建立人性化的情感纽带。
其次,在价值层面,深度学习是 AI 数字人的“创造力”。
每一个 AI 数字人背后都有一个“智慧的大脑”,可以基于语音语义理解等技术,结合不同领域的知识库和海量数据训练,进行深度学习和迭代升级,让自己变得越来越“聪明”,越来越专业,从而能够快速适应瞬息万变的市场变化和细分化的场景需求,不断打破即有的应用边界,为用户持续创造新价值和新体验。
第三,在制作层面,AIGC 是 AI 数字人的“生产力”。
高制作成本和长制作周期掣肘数字人产业规模化发展。传统数字人生产过程中,从人物建模到动画设计和制作等各个环节几乎都依赖人工“雕琢”而成。譬如,以人物建模为例,传统建模环节大概要花费数月时间。此外,要让模型动起来,前面的准备工作(蒙皮、BlendShape 等)以及后续的动画制作及优化环节也需要花费数月时间,无论是时间成本还是人工成本都是一个相对较大的投入。
AIGC 重塑生产流程,在人物模型的重建、动画准备和制作等各个环节辅助数字人自动化生成,大幅加速数字人生产,降低制作门槛和成本投入,是 AI 数字人生产力之本。以人物建模环节为例,例如,商汤科技为软银大会打造的软银 COO 今井康之的 AI 数字人形象,即是基于少量照片的面部扫描,结合 AI 算法快速生成数字人高精度 3D 模型,将传统以月计算的制作周期缩短至数天内完成。
三、AI数字人的三大应用方向
根据使用目的和底层逻辑不同,AI 数字人可大致分成三大应用方向。
方向一:主要以创建 IP 影响力或打造粉丝经济为目的的 AI 数字人应用,包括虚拟偶像、虚拟 KOL、虚拟演员、虚拟主播等。
基于“IP 孵化 + 内容运营”,赋予 Ta 们独特的人设和人格特质,以此来吸引不同受众群体的关注,从而形成一定规模的流量基础和情感链接,再通过诸如直播带货、跨界品牌代言、IP 授权周边衍生品、娱乐演艺等多种手段来实现价值闭环或进行商业化变现。
方向二:主要以替代真人服务、实现降本增效为目的的 AI 数字人应用,包括虚拟客服、虚拟前台、虚拟导游、虚拟主持人等。
Ta 们根据各自领域所长,能够“7×24 小时”在岗不间断的提供服务支持,尤其针对标准化、重复性高的真人服务可以实现数字化替代,并结合业务流程自动化,帮助企业进一步提高生产效率、降低人工服务成本,为企业数字化转型提供新路径。
方向三:随着人工智能、虚拟现实等相关技术的逐步成熟,通过深度学习和认知泛化,AI数字人将会全面突破应用边界,升级成为数字世界的“超级助手”。
与前两个应用方向不同,AI 数字人的第三大应用方向不再仅遵循真实世界的“替代”逻辑,初衷更在于满足用户与数字世界的连接和交互需求,实现对于数字世界的直接操作。正如《元宇宙”破壁人“:做虚实融合世界的赋能者》白皮书中所描绘的图景一样,“这些数字人将成为我们在数字世界的 AI 代理人”。通过与 Ta们的直接交互,可以“随机应变”的针对用户个性化、多样化需求,提供全天候、全方位的人性化陪伴和智能化服务,成为人们通向虚实融合世界的超级入口。
四、AI数字人的八大应用场景
场景1:金融网店“新窗口”
商汤为宁波银行上海分行打造的超写实型 AI 数字人大堂经理“小宁”,以栩栩如生的客服形象为银行客户提供各类业务咨询和服务办理。
生动的形象和拟真的交互体验,AI 数字人让银行客户倍感新鲜,有效提升了客户关注时间,不仅能为银行创造更多业务推广机会,在网点“智能化、无人化”的趋势下,成为银行服务线下客群的“新窗口”,以及提升服务效率、提高服务质量和标准的重要载体。
场景2:在线互金“新入口”
基于手机银行在线服务问题,渤海银行与商汤合作开发 AI 数字人“小海豚”,以生动、可爱的 3D 卡通形象,为渤海银行的线上用户提供全程“贴身服务”,包括自助式业务引导和办理、金融知识的专业讲解,以及理财产品的智能推荐等,为客户创造全新的交互触达式体验,成为手机银行提供在线互金服务的“新入口”。
例如,在自助业务办理上,小海豚可以正确“理解”客户需求,并快速定位到客户所需办理的业务界面,大大缩减了繁琐的操作流程,帮助客户高效完成业务办理,为客户提供了一个亲切交互、快捷便利的无障碍金融体验。
场景3:商场交互“新触点”
广州新塘的永旺梦乐城与商汤联合打造了超写实型 AI 数字人“小糖”,主要承担商场内客服咨询、导航导购等多项服务工作。
例如,作为虚拟客服人员,“小糖”可以随时随地为顾客提供准确、快速的店铺位置导览、停车路线指引、积分兑换等问询服务。当遇到“超纲”问题时,后台管理人员可以及时进行远程接管。作为虚拟导购员,“小糖”通过与顾客的自然交互和意图理解,判断顾客的实地需求,将新品上线、新店开业、优惠活动等商场或店铺信息更有效的向顾客进行精准推荐,有助于营销转化效果的提升。
场景4:文博讲解“新体验”
中共一大纪念馆与商汤合作,于 2021 年建党 100 周年之际在展馆内推出 001 号 AI 数字人讲解员“申小伊”。Ta 不仅能够主动迎接和问候,还能为来自全国各地的参观群众和党员干部讲解中共一大党史。
在形象设计上,“申小伊”达到了超写实级别精度,严格遵循纪念馆内制服标准着装“上岗”;在讲解专业性上,“申小伊”基于中共一大相关的党史典籍建立知识库体系进行深度学习,并通过知识泛化覆盖上万条党史问题,不仅能够熟练讲解党史内容,还能轻松解答各类党史相关问题。
场景5:品牌营销“新代言”
商汤基于 AIGC,仅结合几张真人照片即快速生成超写实 AI 数字人“大真”。Ta 不仅可以充当活动虚拟主持,与同台真人主持一起与观众进行实时互动,还可以登录直播间 24 小时不间断直播带货,与用户“面对面”进行弹幕互动,自助解答品牌相关问题。
场景6:企业前台“新形象”
根据企业形象定制的 AI 数字人,不仅拥有符合企业文化气质的外观形象,还能替代真人前台根据员工预约信息,对已预约的到访客户进行主动式的迎宾接待,并基于丰富的企业知识库体系,为到访客户进行企业介绍、发展历程的讲解,并能与访客进行实时对话,亲切耐心地解答企业相关问询。
场景7:指挥车舱“新助手”
车机大屏已成为新一代智能终端,承载着载具内人机交互、调用软件服务等功能,也影响着智慧车舱的交互体验。将车机系统功能进行集成,并通过生动的 AI 数字人形象作为人机交互的主要媒介,相对传统语音或触屏等方式,为车主带来更具个性化、人格化的行车体验。
场景8:虚拟活动“新服务”
在沉浸式活动 / 会议系统中,AI 数字人可以作为活动随行助手,全程“陪伴”参会者左右,随时随地提供咨询服务,回答活动相关问题,并提供活动接待、讲解、导览、记录、推介等各类服务和支持。一方面减少活动主办方人工客服投入,提升用户体验;另一方面可以通过对 AI 数字人交互数据的收集和分析,帮助主办方掌握参会人员实际需求,更好的实现活动效果的转化,达到主办活动的目的。
本文转载自公众号数字化助推器 作者:天涯咫尺TGH