如何缩小中美通用大模型差距? 我在两会看到了答案

人工智能 新闻
与开展“人工智能+”行动相呼应的是,20多位全国人大代表或政协委员都谈到了大模型相关,覆盖到从底层数据算力、模型层以及应用层的方方面面,为当前正面临的挑战建言献策。

“通用大模型关乎国运之争”……

“人工智能+”首次出现在政府工作报告中,并直接上升为一种行动 。

雷军刘庆峰等代表委员都将人工智能纳入到自己的建议之中;

又是一年两会进行时,AI大模型受到前所未有的关注。

彼时在大洋彼岸的另一边,GPT-4正被最新大模型全面超越,Sora新视频持续惊艳网友。

图片

一时间,关于国产通用大模型未来发展、中美之间差距还有多少的话题再次引人注目。

既如此且先来看看,两会都聊了啥?或许能从中找到答案。

人工智能火爆两会

与开展“人工智能+”行动相呼应的是,20多位全国人大代表或政协委员都谈到了大模型相关,覆盖到从底层数据算力、模型层以及应用层的方方面面,为当前正面临的挑战建言献策。

通用大模型又成为这其中的关键词。这样的盛况,以往并不多见。

在具体建议中,可以看到大概有三个方面:技术瓶颈、未来发展以及应用落地。

  • 技术瓶颈:数据、算力和产业生态

当前国产大模型技术瓶颈还有哪些?包括科大讯飞董事长刘庆峰、知乎创始人周源、京东集团技术委员会主席曹鹏、中科院计算机所研究员张云泉等在内都发表了自己的看法。

知乎创始人周源谈到了数据方面的挑战,他认为对大模型数据采集进行监督和审查。

京东集团技术委员会主席曹鹏中科院计算机所研究员张云泉等在内都谈到了突破算力瓶颈,曹鹏鼓励国产算力软硬协同,张云泉提出了集中AI芯片研制、设立智能算力发展专项组等几个方向的建议。

科大讯飞董事长刘庆峰则从算力、底座平台、源头技术研发等维度介绍了我国发展大模型存在的短板,并建议制定国家《通用人工智能发展规划》,来缩小中美通用人工智能产业的差距,打造我国的比较优势。

  • 未来发展:教育人才和政策法规也成关注焦点

技术之外,教育、人才建设、政策法规等方面也成为了代表们的关注焦点。

小米创始人雷军提出了三项人才相关的建议:从义务教育阶段普及人工智能素养教育;大力推进高校人工智能相关专业的建设;支持大型科技企业和教培机构培育人工智能应用型人才。

还有一些法律界人士,比如金杜律师事务所高级合伙人张毅,提出推进《人工智能法》的出台。

  • 应用落地:如何赋能千行百业?

值得一提的是,此次还有来自影视、体育、农村、养老、制造、文旅等各行业代表也都参与到对于人工智能发展的讨论之中。

比如Sora对影视行业的影响,演员靳东在接受采访时谈到一些服务型的岗位可能会被替代,但短时间内,人工智能很难替代影视等创作行业。

还有像美的副总裁钟铮拈花湾文旅董事长吴国平天能控股集团董事长张天任提到了人工智能在制造业、文旅、养老等行业的应用。

……

可以看到的是,大模型毫无疑问地成为此次两会的焦点。在二十多位人大代表或政协委员的提案中,其实也能总结出当前国产大模型的发展缩影:技术挑战仍在,人才政策得跟上,应用发展要加速

中美差距还有多大?

ChatGPT的出现,国内掀起千模大战,部分玩家的大模型在一年时间实现了对标GPT-3.5的实力,部分能力超过了GPT-4。

而Sora横空出世,仅需通过文本即可自动生成1分钟视频,给视频生成领域带来了颠覆,其展现的性能对同类产品实现了碾压……

于是乎,关于中美之间的差距是否进一步加大再次引发热议。数据、算力、人才培养和投入成为这当中讨论的焦点。

但中美差距具体还有多大?始终没有什么定论。

此次两会上,科大讯飞董事长刘庆峰首次给出了定量描述——

1-2年,追平

为什么会是这个数字?刘庆峰做了进一步解答。

他认为中美博弈的“主战场”就是在通用底座能力上持续进行对标。而Sora正是基于GPT-4/4V的通用大模型底座能力所延伸出来的特定领域的成功实践。

同样延伸的还有像DALL-E3、Whisper。

他还以讯飞星火大模型为例,预计6个月内可达到GPT4/4V当前最好水平。但随着GPT-5的发布,“这个差距可能会被拉到一年以上”

因此他也强调称,这也会是一个你追我赶的动态过程

在刘庆峰这一推论中,在人工智能领域,将通用大模型推至到一个高点,成为中美之间差距的核心竞争点。

也有代表此次在两会上表达了类似的观点:通用大模型的发展,已不是单纯的科技之争,更是国运之争,影响深远。

过去一年可以看到,通用大模型已然成为业内玩家的发展共识。

在模型层,关于长文本处理、多模态、逻辑推理、数学编码等技术突破,以全方位提升通用大模型的理解能力。基础设施层,自主可控算力生态也构建开来,国产算力软硬协同来支撑大模型创新和应用。

当然最明显感知的发展变化,还是应用层的全面开花

来自医疗、教育、广告营销、制造等各个行业领域的传统玩家,基于通用大模型底座平台以及行业数据,得以让大模型在自身领域加速应用。

千模大战之中,绝大多数也都是行业和垂直领域大模型。而如果没有通用底座大模型的支撑,行业大模型的成效将无法持续进步。

因此,中国必须要有自主可控、对标国际一流水准的通用底座大模型。

这当中最具代表的践行者就是科大讯飞

过去一年,他们有两个进展值得关注——

一个是中国首个支持万亿浮点参数的国产化算力平台“飞星一号”,联合华为实现国产算力的自主可控。

另一个基于该平台发布讯飞星火V3.5,整体效果逼近GPT-4 Turbo,并初步形成大模型产业生态。

图片

基于算力和持续升级迭代的通用大模型,他们在医疗、教育、工业等场景中有了深度应用,已率先构建出行业领先的大模型产业生态——

截至今年1月,讯飞星火纯用户2400万,基于讯飞听见、讯飞星火APP、讯飞输入法等应用,星火已累计赋能亿万用户。大模型开发者生态积累37万开发者数量,其中企业开发者数量为24万……并从中以此形数据闭环,自驱动大模型的迭代和落地。

过去的发展成绩表明:以科大讯飞为代表的通用人工智能国家队在推动大模型的落地,我们有基础,也有自身的场景和数据优势。但同样也要客观看到差距、正视差距,缩小中美底座大模型的差距。

全球竞争更加激烈,通用底座呼之欲出

2024年刚开年,以天为单位的AI新进展再次让全球无眠。

颠覆视频生成的Sora、全面超越GPT-4的Claude 3、还有Stable Diffusion 3的发布,而在产业链上,英伟达正式突破2万亿美元震惊股市……

图片

显然,全球竞速没有放缓,反而更紧迫了。

但同去年ChatGPT刚出现时百模大战千模大战的各家探索不同,今年国内却显得冷静许多。因为有关技术趋势的共识已经再明显不过:

  • 多模态融合,包括语音、图像、视频等多个模态融合已成为国内外科技大厂大模型升级和迭代重点;
  • Scaling Law反复被验证,大模型的不同流派走向统一;
  • 软硬件一体,产业链上下游共建的通用底座,更加呼之欲出。也只有通用底座,才是综合实力、长治久安、基业长青、支撑千行百业“AI+”的基石。

有意思的是,这样的洞察,也在两会上也被提及出来了。

刘庆峰给出了全面系统的建议。

他建议在2017年《新一代人工智能发展规划》的基础上,系统性制定国家《通用人工智能发展规划》,以顶层设计来推动通用人工智能的发展。

与此同时,相关工作也要同步展开,为此刘庆峰给出了九点建议。

首先第一点,聚焦通用大模型“主战场”,整合各方资源,持续加大投入。

比如包括以专项的形式在未来5年持续支持研发攻关、支持算力基础设施建设、推动工业和民生等领域的大模型应用等。

随后,就是加强源头技术布局,围绕通用人工智能相关领域,布局战略性、前瞻性基础研究,坚持以源头核心技术突破来推动颠覆式创新的探索。

除了大模型技术外,还要加快脑科学与类脑智能、量子计算以及推动AI for Science的发展。

更为具体的建议还有:

建议加快形成以国产大模型为核心的自主可控产业生态。

建议推动国家级高质量训练数据开放和共享,支持国家战略科技力量以揭榜挂帅形式优先、低成本使用。

建议出台更加客观、公正、可信的评测方法,推动大模型在行业领域应用的健康发展。

除此之外,他还强调了人才培养、法律法规以及伦理人文研究方面的重要性。

尤其是人才培养,他不仅强调了顶尖的创新人才、应用型人才的培养,而且建议加快推广人工智能通识教育,赋能基础教育、职业教育和高等教育全学段,并且建议设立国家人工智能学院。

对于未来可能会被人工智能大量替代的行业和岗位,他认为应该研究新型人才能力素质模型和培养方案。

这样的洞察和建议,之所以系统和全面,一方面是讯飞本身是人工智能国家队,懂行。另一方面,常年的人工智能产业深耕,也让它对产业需求有更深的洞察。

透过此次两会上各位行业代表们的观点,可以看到社会的共识是:

通用大模型是必经之路

从全球发展来看,实现算力、产业生态的自主可控,才能保证大模型的持续迭代和应用,在全球竞争态势下才能占据一席之地,拥有话语权。

民生社会层面,以大模型为代表的新质生产力,正成为支撑社会发展的新型基础设施。从技术研发到商业落地,这条发展路线上一以贯之的最终目标,都是为各行各业提质提效。

所以即便现在差距仍不可忽视,但包括国产大模型的核心玩家,已经初步探索出了一条自主可控之路,赋能到各行业,这也是大模型的真正价值所在。

“互联网+”“人工智能+”,新质生产力机遇,未来可期,中国可期。

责任编辑:张燕妮 来源: 量子位
相关推荐

2013-07-15 10:25:27

2013-08-16 10:12:57

C编程风格

2022-12-26 00:00:02

数据驱动业务

2017-06-15 08:52:36

数据分析可视化软件开发

2024-07-29 08:47:00

2018-10-31 12:39:39

区块链电子证据安全

2020-09-20 17:50:38

编程语言PythonJava

2017-06-14 18:04:10

2017-03-21 16:03:25

2010-08-19 15:48:06

DB2 diag.lo

2020-10-29 15:49:01

人工智能

2017-03-14 09:30:47

互联网金融工作报告

2021-11-29 22:09:36

人工智能AI

2021-03-07 00:27:54

区块链互联网技术

2024-10-21 16:13:07

2021-06-28 13:20:15

谷歌AI芯片

2021-04-28 15:02:00

云计算华为云

2022-02-22 10:58:53

冬奥会5G运营商
点赞
收藏

51CTO技术栈公众号