2022年11月30日,ChatGPT正式面向全球发布,AIGC浪潮由此席卷而来。
实际上,AIGC技术由来已久。
1957年,Lejaren Hiller和Leonard Isaacson通过将计算机程序中的控制变量改为音符,用计算机创作了音乐作品《Illiac Suite》。
2014年,美国《洛杉矶时报》记者Ken Schwencke通过编写的算法程序,仅用3分钟就完成了当时洛杉矶发生的一场4.4级地震的新闻报道。
那么,当下AIGC又有了怎样的颠覆式技术?处于一个怎样的发展阶段?产业应用如何?以及存在哪些风险?
针对这些问题,我们与中国信通院云计算与大数据研究所副总工程师王蕴韬进行了一次深度对话,从他哪里找到了这些问题的答案。
大模型,再次唤醒AIGC
“和传统基于深度学习技术的AIGC相比,以GPT为代表的生成式大模型在去年年底的出现,直接将AIGC内容质量和好用程度提升到了一个新高度,AIGC这把火由此也再次被点燃。”这是王蕴韬看到的行业变化。
大模型的出现,对各个行业都带来了不可忽视的影响,AIGC产业也不例外。
这其中AIGC的“C”,不仅仅是指OpenAI的ChatGPT带火的“chatbot”中的文本内容,还包括诸如图片、视频、代码等内容形式。
尤其过往十年人工智能技术的快速发展,让人工智能技术在诸如图像/视频修复、低代码等领域有了一定的应用,大模型的到来才能进一步对这些产业形成一次颠覆。
关于这次对于人工智能的技术颠覆,王蕴韬将其中的直观感受总结为“可用”到“好用”。
对此,他进一步指出:
因为人工智能技术路线一直是在仿人类的神经元功能演进的,在这之中,我们经历了“低仿”到“高仿”的发展阶段。
此前基于深度学习的人工智能,是通过CNN、RNN网络,先是做一个线性变换,再经过一个激活函数,从而实现“低仿”人类神经元的算法模型。
现在再度火起来的AIGC背后的根技术是Transformer,有点类似编码器和解码器,通过将编码和解码放在一起,从而同时吸收更长的字符串(token)来做相关的任务处理。
从深度学习到现在的大模型,我们用的依然是广义上的深度神经网络,只不过这个深度神经网络基本单元发生了变化。
大模型的出现,改变了构成AIGC的基本单元,让AIGC从“可用”跨越到了“好用”阶段。
AIGC造“血”,行业内容涌现
2023年是大模型的战场,在这个战场上,悄悄进行了两场军备竞赛。
第一场是关于通用大模型,包括国外的微软、谷歌、亚马逊,以及国内的BAT等科技巨头,都加入到了这场竞赛中。
他们通过引入规模庞大的公开数据集、通过预训练,形成了通用大语言模型。
王蕴韬称,这个通用大语言模型,实现了大模型从0到1的构建,但实际上是“0.5版大模型”。
之后在行业大模型的竞赛中,真正适合深入到应用阶段的大模型才开始出现。
关于后者,王蕴韬称,大家主要是基于“0.5版大模型”在微调,通过不断灌输行业知识,增加与人类专家的交互,从而将“0.5版大模型”调试得更加好用。
经此“历练”,AIGC最终有机会进一步深入到各个行业,为各行各业造“血”。
“所有行业都需要生产内容,实际上,如今的AIGC已经在金融、电商、影视、传媒等领域开始被规模应用。”
以影视和传媒领域为例,这一领域各类机构和企业的核心竞争力就是提供内容,这些机构如果能够通过AIGC低成本高质量生产内容,必然会形成一次产业颠覆。因此,我们能够看到,现在影视行业已经在用AIGC进行后期制作,例如AI换脸就是已经被大家熟知的热门应用。
再如在电商领域,其中的直播带货、客服咨询等环节所需要内容服务都是AIGC最擅长的,而AIGC在电商内容生成上已经达到了非常理想的效果,尤其是人类很难实现的诸如直播带货中的24小时不间断货品推荐,已经在通过AIGC来实现。
据王蕴韬的观察,“实际上,在教育、工业、医疗、法律、农业、设计、软件,软件编写上,AIGC也确实已经遍地开花。”
大模型评估标准难题
AIGC及其背后大模型的到来带来的另一个难题是,如何建立起一套全新的评判标准。
在此之前,AI模型和算法经过几十年的发展,已经形成了一套成熟的评判标准,不过王蕴韬告诉我们,这套标准并不适用于现在的AIGC和大模型。
此前学术界会先搭建一个评测数据集,通过将这个数据集放到不同模型中并对比输出结果,以及与相对原有数据集的差异,从而判断AI模型的能力,诸如斯坦福等高校都是这方面权威评测机构。
然而,“这样的评测方法仅适用于原来判别式的AI模型,无法对现在生成式AI有一个很好的评测效果。”
从目前来看,国内对于大模型和AIGC一些场景应用的评测及标准,尚且处于探讨和研究阶段,据王蕴韬透露,“信通院专门针对大模型和AIGC的评测评估标准做了不少探索性工作,但目前这些标准主要还是围绕功能性指标,包括一个AIGC应用全生命周期实现哪些功能,这一块我们已经梳理出来了。”
但是针对AIGC背后大模型的性能有怎样的突破,这仍是一个行业难题。
“大模型每次生成的东西都会有明显的差异,如何判断每次输出都不一样的开放性输出和预想的输出的契合度有多少,这是目前评测最难实现的点。”
王蕴韬表示,“目前我们只能通过主观评价指标才能确定大模型究竟在性能上有多少提升,而针对相似度评估,整个产业界依旧非常欠缺。”
除此以外,王蕴韬还特别指出,如何让大模型可管、可控,安全地工作,同样是现在亟需解决的一个问题。
尤其是对于实时性、安全可控有高要求的行业和场景,现在尚且难以很好地应用AI大模型,“因为你完全无法预料大模型会输出怎样的结果。”
实际上,早在2021年,大模型刚刚兴起时,产学研各界就已经注意到了人工智能的安全可信,“我们当时做出过一个判断:人工智能已经进入到产业发展和治理重要度相同的新阶段。”
“原来大家都只是盯着产业发展,只踩油门,不踩刹车,现在来看,因为它在赋能垂直行业过程中会产生很多伦理相关的问题,确实已经进入到了一个新阶段。”
正因如此,在大模型进入对地域性、安全性较高的行业时,也出现了私有大模型这样独特的应用,尤其在数据安全越来越被重视的当下,私有大模型也成了通用大模型、行业大模型之外,一个更具时代特色的大模型。
现在全球对于到底什么样的AI是合乎科技伦理的、是可信的已经基本达成一定的共识,但是现在需要将这些宏观的、抽象的要求转化为企业真正在开发产品时落实的一个准则。
AIGC需要被再次颠覆
大模型带来的技术颠覆,为人工智能技术创新带来了新的范式,但第一波赚到钱的,依然是“卖铲子的人”。
王蕴韬表示,“通过堆算力的方式‘堆出来’的大模型效果已经很不错,但从商业角度来看,训练成本和推理成本之高,消耗电量和算力之大是难以想象的。因而,现阶段大模型解决的问题带来的效益远比它的成本投入要低。”
王蕴韬认为,针对大模型的商业化,接下来还需要供需方朝着两个方向发力:
第一,从供给侧来看,现在的大模型还有进一步压缩成本、提高性价比的空间。
大家已经意识到了以Transformer为代表的根技术还存在很大的问题,例如每增加一个token,它需要的算力是呈指数级增长的,对于由此带来的成本,同样如此。因此,从供给侧来看,目前仍然有很大的提升空间。
第二,从使用侧来看,现在AIGC做得最好的往往是企业自身数字化转型程度很高的,提升自身数字化程度也就成了企业高效应用AIGC的一个必然前提。
如果想要在更广泛的领域去应用AIGC技术,我们就需要这些领域在自己的数字化方面有更好的基础建设,这个基础的提升同样需要大量的资金、人力和时间的投入,先拥有更高数字化建设基础的企业和行业,也将先受益于AIGC技术红利。
而谈到当下大模型的技术路径,王蕴韬也特别指出,现在已经有高校和机构意识到了商业化的问题,开始思考区别于Transformer的新的技术路线。
他指出,“从‘好用’到‘高效’,AIGC在未来也许会再经历一次或多次技术范式的颠覆。”