AIGC 人工智能生成内容,相对更早的内容生产模式分别为专家生产内容 PGC 和用户生产内容 UGC。而随着 AIGC 出现,内容生产率变成指数级上升。那么AIGC发展对于普通人来说到底意味着什么?
先回顾一下时间轴,
2015年7月,谷歌推出 Deepdream 开创 AI 模型根据文本生成图像的先河。
2021年1月,OpenAI 发布达人 DALL-E 模型,让文本生成图像真正卷出了天际。
2022年7月,独立实验室 Midjourney 发布同名图像生成模型。Journey 设计师 Jason Allen 用AI生成图片,太空歌剧院,在克罗拉多州博览会的名声比赛中获得投奖,并感慨艺术意思,人类输了,引起全球热议。
2022年8月,stability AI 的开源图像生成模型 stable diffusion。仅需一台电脑就能运行,截至当年10月,已有超过20万开发者下载这一系列模型引爆了 AI 作画领域,标志着人工智能向艺术领域的渗透。
与此同时,2022年12月,OpenAI 的大型语言生成模型 ChatGPT 引爆全网,能做到和人类对答如流,胜任高情商对话能进行短文、诗歌、代码计算逻辑等不同类型的内容输出,让人不禁怀疑 ChatGPT 是否真的已经具有人力智能,仅过了短短几个月,升级版 GPT 4横空出世,不光能实现图文多模态输入,在专业领域也表现出媲美人类甚至超越人类的水平。
2022年是 AIGC 元年,代表新一轮范式转移的开始。AI 模型在文本图片生成方面效果令人惊喜,在视频和3D 等高复杂领域逐步探索阶段,但对 AI 的学习速度来说,拿下这些领域也只是时间问题。
以上所有都不是突然出现的 AIGC 之所以能在22年爆发,至少具备以下四项条件。
一、模型训练技术革新:与其他行业不同,AC是开放科学、不断创新在生成算法优质模型、开源加速技术变革,其中 OpenAI 开源的CLIP 多模态预训练模型能同时进行自然语言理解和计算机视觉分析,这让模型训练可以直接利用互联网上自带文字描述的图片素材,大幅降低了数据获取门槛,也是图像生成模型的技术基础。
二、合成数据驱动训练。早期模型训练最大掣肘就是数据,面临数据标注,费时费力且准确率低,样本数量无法覆盖边缘案例,稍微长期数据难以采集隐私数据面临法律法规限制等问题。但随着生成式 AI 的发展,模型产出的合成数据又反哺模型训练过程,形成加速飞轮。可以说合成数据影响了 AI 的未来。
三、GPU 芯片支持。我们通过网络感受 AI,但真正的模型训练需要投入巨额资金驱动巨型服务器,这也直接使 GPU 芯片和服务器制造商 英伟达发展成为了全球最有价值的公司。
四、产业生态逐渐成型。首先是上游预训练模型,超过80%的人工智能研究都集中在基础模型训练上,这一层的门槛很高,例如语言处理模型 GPT 3的训练成本粗略估算1,200万美元。因此有能力做预训练模型的主要为头部科技企业和独角兽公司。其次是以优秀的预训练模型为根基,开发和销售垂直细分领域的中间模型及服务 model as a service 成为现实,这一层就比较适合初创公司和个人创业者。
你可能会问,作为普通人知道这个有什么用啊?
基于 GPT 模型,有人拿 ChatGPT 写作业,有人组合多个 AI 工具全自动做视频,有人利用信息差拿 AI 效果图赚钱,有人发现提示词带有学问,甚至有人拿 AI 违法乱纪。
总而言之,AIGC打开了新世界的大门。
反观我国自主 AI 研发都是可能是庞大的人口规模,更可能产生专业人才训练数据,但劣势是忽视 AI 的高昂训练成本,让普通企业望而却步,很多所谓的大厂就是坐拥广阔市场,大玩割韭菜游戏,GPU 算力才是 AI 的本体,但从2018年开始,美国不仅限制中国进口高端芯片,还限制中国获得生产芯片的工具。这么一盘中国 AI也是任重道远。
了解背景后,我们就来看看 AIGC 广阔的应用前景。
一、设计提效。在商业领域可以批量生产设计方案,并对方案的价值进行精准预判,例如日本中视会社 Plug 提供 package design AI 只需使用者上传素材,AI 就可以一小时内自动生成上千种包装设计,并在10秒内计算出他们的受欢迎程度。日本零食大牌卡勒比曾找他们合作,优化后的业绩比旧包装增长了135%。
二、珍贵资料的修复,百度利用文心模型上浮春山巨土重生。腾讯利用 AI 助力敦煌壁画的修复,极大提升文物保护的效率。2022年4月1日,AI 技术修复的港星张国荣的演唱会,以4K 高精品制让无数人民泪目。也许不久的将来,AI就能用 VR 带大家穿越上世纪初的演唱会现场。
三、数字孪生技术,充分利用 AI 模型在虚拟空间中完成真实场景的建模映射,并推演实体的生命周期。在产品设计、医学分析、高危公众安全、城市建设等领域运营较多。特斯拉正在构建一个巨大模型,以更安全高效的方式实现其自动驾驶汽车的训练目标。
四、元宇宙的内容基础,元宇宙中不仅有用户,还应该存在很多类似 NPC 的智能体,为用户提供交互服务。这些智能体agent就很需要 AI 模型生产并驱动。
五、人类生命的数字化延展。近几年艺人频频爆雷塌房,导致品牌遭殃害,虚拟人充当代言人风险和效率都会可控很多。而对于生病的人,AI 可以生成治疗方案,甚至可以生成语音,帮助师生者开口讲话。全世界第一个赛伯格彼得斯科特摩根以自己的身体作为实验对象,用 AIGC 技术不断和变动中斗争,再激进点甚至可以进行人类的数字化改造。除了活着的人,AI 具有很多学习人类的录像、音乐资料以数字化的方式呈现。
当然,AIGC 也有自己潜在的不足和风险。
1.安全挑战,包含但不限于以下,就拿 ChatGPT 来说,它能随机生成大量,看起来正确,但仔细检查却是错误的答案。如果这些错误信息被无脑搬运到网络平台,严重干扰网络知识的准确性。虽然很多严肃的技术交流网站已禁止用户分享 ChatGPT 回答,但现状就是很难区分这个内容的创作者到底是 AI 还是人?即便OpenAI 自己制作的内容程序,准确率也难以做到完全正确。
人们对使用 Chat GPT 学习感到兴奋,但危险在于,除非你已经知道答案,否则你无法判断他什么时候生成的结果是错的。很多不法分子利用开源的 AI 模型,以更低的门槛、更高的效率来去做恶意内容。例如 stable diffusion 开源后很快就有人将它用作搞颜色平台,声称迄今为止已生成超过400多万张颜色图片了。与此同时,借助 AI 学习和伪造影视频内容,盗用个人身份进行敲诈勒索,2021年就有诈骗团伙利用 AI 换脸 yellow mask 半年诈骗价值超过2亿元人民币的数字货币。
2.个人隐私碎片。随着我们上网冲浪,遍布互联网,AI 模型强大的推理能力可以通过信息多元互证拼凑出完整的个人数据,如果被不法分子滥用,真是防不胜防。在模型及服务的产业结构下,再精密的 AI 模型,也难免存在一些内生安全问题,在遭受攻击或数据中毒时,如何将有毒数据去除,并且保证用途数据的安全也是极大的问题。
伦理挑战训练模型都是依据人类世界的数据,因此天然会延续并放大人类社会已有的社会偏见和刻板印象。OpenAI 的 ChatGPT 和达人模型在文字和图像生成结果中都有明显的宗教偏见和性别歧视。并且 AI 模型还很容易被交换。微软推出的聊天机器人不到24小时就被调教成一个集反犹歧视、性别歧视于一身的不良少年。
3.在知识产权问题。AI 模型学习了大量人类的作品数据,难免会模仿优秀创作者的个人风格,很可能构成著作权侵权。再者,由 AI 模型生成的作品著作权应当归用户训练模型的公司创造这种风格的设计师还是 AI 模型自己,都将引发争论。
4.人文方面。AI 模型被用来复活已故演员,创造群众与使者交谈的可能,但试着没有也不能行,是同意或拒绝权利,因此有学者认为这是损害了曾经活着的人的隐私权和代理权。如果 AI 模型有自我意识,不仅每天能影响并且阅读悲惨世界,在人一样害怕死亡,甚至拥有灵魂,那么它能有人权吗?22年谷歌 AI 工程师怎么声称它们的 AI 聊天机器人Lambda 具有自我意识?再一次将这个问题拉上了台面。
5.环境挑战。AI 模型,无论是训练还是运行,都会消耗大量资源。OpenAI 的 CEO Sam Altman 也表示,虽然 ChatGPT 聊天成本只有每次集美分,但随着用户激增,当不得不因为计算成本暂停免费模式,就拿大火的绘图模型为 journey 来说,现有数十万用户比占用极高算力,如果用户量达到1,000万人,全世界都没有足够的算力来支持。
6.集权挑战。 AI 竞争中难免赢家通吃,培训一个优秀的 AI 模型,成本已经远超个人承受范围。斯坦福大学这样的特别资助,高等院校也无力建造基于 Nvidia 芯片的超级计算机。经济学家担心对 AI 的效率痴迷,会让全社会飞向图灵陷阱越来越多的人失去工作,他们争取公平分享自动化好处的能力受阻财富和权力会掌握在越来越少的人或公司手中,普通人难以跨越阶级。
由此带来的另一个问题就是国家安全受到威胁,AI 既然可以为企业和个人服务,那也可以为国家出谋划策,比如制造超强计算机病毒,或者制造错误信息进行低成本规模化的意识宣传。就像军事大国坚持要有自己的卫星核武器一样,他们也会想要坚持有自己的大脑而拥有强大的 AI,对于其他国家来说就形成了降维打击。
7.最后就是全人类的生存威胁。想象一下,如果某实验室的模型构建了一个可以构建更好模型的模型,然后这个更好的模型又构建了一个更好的模型,且它们都学习成本非常快。这让我不禁想到女作家玛丽雪来1818年的小说,科学家Frank用死人器官拼凑出一个有自主意识的人形生物。最初他心地善良且学习很快,但因得不到社会的理解,最终发展成为社会秩序破坏者。Frank起初对于自己拥有了创始能力,而洋洋得意,但他发现问题DL的严重和不可控制时,又内疚万分。
AI 的发展从来不是匀速直线运动,而是指数量级的飞速变化。就像一艘列车,我们一直盼望搭上 AI 专列,去往更美好的未来,但它一直不来,而它真正来临的那一刻,也许只有极端的一瞬间,如果没有抓住机遇,人类便会被 AI 远远的甩在身后,这时,或许只能祈求自己亲手创造出来的上帝足够仁慈。
人类正在巨变前夜,AI 时代也正在到来,变革必然会产生阵痛。与历史上任何一个阶段的伟大创新一样,人类将不得不在前进过程中摸索应对方法。无论结果如何,没人可以预测未来,但有一件事情是可以肯定的,那就是没有回头路。