Questel:2024深度学习与大模型全球专利全景报告
“欧米伽未来研究所”关注科技未来发展趋势,研究人类向欧米伽点演化过程中面临的重大机遇与挑战。将不定期推荐和发布世界范围重要科技研究进展和未来趋势研究。
Questel是一家世界著名端到端知识产权解决方案提供商,为超过20,000家客户和150万用户提供服务,覆盖30个国家。主要提供软件套件,用于发明和知识产权资产的搜索、分析和管理。
简述
深度学习和大型语言模型(LLMs)专利的关键趋势图示
深度学习领域知识产权保护的激烈竞争,全球DL领域的专利活动显著增长,自2017-2018年以来,LLMs逐渐崭露头角。2022年OpenAI推出ChatGPT标志着一个重要的转折点,加速了公众认知以及专利申请的步伐。这场全球范围内的知识产权竞争凸显了其战略重要性,其中中国和美国领先:
- 中国:以百度等企业为核心,由顶尖高校支持的集中式创新生态系统。
- 美国:多元化、分散式的创新格局,由IBM、谷歌和微软等科技巨头推动。
LLM领域的整合与机会,LLM领域由少数几个主要玩家主导——包括谷歌、百度、腾讯、微软、亚马逊和阿里巴巴,其专利组合展现了其全球影响力。几项显著的趋势如下:
- 谷歌、百度、微软和腾讯正积极保护并推进其产品,凸显了这一仍被视为新兴技术的市场成熟度。这些公司在所有列出的应用领域中均为专利申请的领导者,展示了其全面的战略和对LLM应用全谱系的承诺。
- 医疗健康作为增长领域:LLMs在诊断、药物研发和个性化医疗方面推动了突破性进展,使医疗健康成为一个具有变革性的领域。
- 扩大行业影响力:随着计算效率和数据质量的改进,LLMs迅速与市场需求对接,正在重塑金融、教育和网络安全等行业。
报告综述
深度学习:基于实例学习而非规则学习,人工智能正在以惊人的速度变革,推动了一场前所未有的创新浪潮,这将在本报告中详细阐述。在AI的表面之下,是由机器学习、神经网络和深度学习(DL)等技术交织而成的复杂体系。这些层次相互结合,推动了突破性的进步,为该领域的快速演变作出了贡献。
图1 - 人工智能的结构
2021年,我们在关于深度学习的研究中引用了Gartner 2020年技术成熟度曲线(Hype Cycle),以展示AI各个部分的成熟度和发展情况。将当时的快照与2024年的技术成熟度曲线对比,可以发现显著的演变(每个阶段的描述见附录)。例如,“深度学习”在不到四年的时间内,从“幻灭期”转变为“生产力高原期”(主流采用阶段)。然而,最引人注目的变化是生成式AI(Generative AI)的迅猛崛起,以大型语言模型(LLMs)为驱动。2020年还只是处于“创新触发”阶段的生成式AI,到2024年已经快速迈入“期望膨胀顶峰”的后期阶段。在专利领域,这一阶段尤为关键,应该被视为获得专利并加强专利组合的机会,以提高未来市场的竞争优势。
图1 - Gartner人工智能技术成熟度曲线2020年与2024年对比
LLM的崛起:革新信息处理和生成方式,LLMs是生成式AI热潮的核心。这些模型由深度学习驱动,旨在处理、理解并生成类人文本。但其能力远不止于此——它们可以分析数据、解读复杂模式并以一种类似人类的方式提供见解。这些模型基于包含数十亿甚至数万亿参数的海量数据集进行训练,正在重新定义数据处理的可能性。
- 规模:LLMs基于庞大而多样的数据集构建,具备无与伦比的学习能力和适应性。
- 语境掌握:它们擅长理解语言的细微差别,从语义细节到整个段落的流畅性。
- 文本生成:无论是撰写文章、回答问题还是生成对话,LLMs都能生成连贯、相关且吸引人的内容。
- 多功能性:其应用涵盖内容生成、翻译、情感分析、聊天机器人等多个领域。
我们探讨的关键问题包括:
- 哪些国家处于LLM创新的前沿?
- 哪些公司和研究机构正在推动进展,谁在全球范围内处于领先地位?
- LLM的主要应用领域是什么,相关知识产权归谁所有?
通过回答这些问题,我们旨在提供对LLM专利格局的全面理解,挖掘新的机会和视角,以指导利益相关者在这一前所未有的创新时代做出明智的战略决策。
方法论
1. 数据来源与检索策略
本研究使用的主要数据来源是 FamPat 全球专利数据库,通过 Orbit Intelligence 检索工具进行检索。FamPat 是一个全球专利申请和授权专利的集合,基于简单专利族进行组织,涵盖全球 100 多个专利机构,并包括来自 22 个专利局的可检索全文,由 Questel 提供。由于每条 FamPat 记录可能包含许多具有不同日期的单独发布事件,本报告采用每个专利族的 最早已知首次提交专利局的日期 作为参考。这一日期被视为专利族的代表性成员日期,用于标识专利族。
首次提交专利局(Office of First Filing, OFF) 指的是某项发明的第一份申请,当这份申请在某专利局提交时,它会成为“优先权申请”,而事件发生的日期则定义为 优先权日期。优先权国家是指首次提交的国家。
报告中的表格和图表均使用优先权日期(除非另有说明),因为它可以最准确地反映发明活动。专利来源的定义(即专利族的发源地)基于首次提交专利局(OFF)。需要注意的是,这一定义并非百分之百准确,但仍然提供了一种有用且公平的方法来识别实体的通常优先权国家,这通常与其本土专利局一致。
每个专利族与一个或多个实体相关联,这些实体统称为专利权人。如果同一专利族中的专利由多个所有者持有,则将该专利族归属于所有相关实体。为了提升可读性并提供清晰的概览,本报告对提及的申请人进行了系统性整理,并将其归属于各自的母公司。子公司和关联实体被归入其母公司,以反映统一的所有权结构。这一归类过程结合了自动化(通过 Orbit Intelligence 数据库)和人工方法完成,并基于报告创建时公开的最佳信息进行操作。
2. 分类体系
本专利分析以深度学习(DL)为中心,特别关注 大型语言模型(LLMs)。检索方法结合了多种策略,包括深度学习相关的关键词和技术,以及相关的专利分类,例如 G06N3/02(使用神经网络模型的计算机系统)。
为了确保结果在全面性和准确性之间达到平衡,检索中采用了布尔逻辑操作符以及迭代优化过程。这种系统化的方法确保了分析数据集的稳健性和可靠性。
虽然专利未必总是明确提及具体的应用,但对这些专利中描述的应用进行探索可以提供有价值的见解。与企业通信或营销材料相比,这种方法为当前热门应用提供了一个独特而互补的视角。
为了提供更深入的理解,我们参考了领域特定的文献,汇编了一个全面的 LLMs 应用清单。该清单突出了LLMs在各个领域的潜力,提供了新鲜的视角和可操作的见解,以帮助解读这一快速发展的技术。应用清单及其描述见报告末尾的附录。
深度学习全球专利格局
1. 专利申请趋势
爆炸性增长:深度学习的热潮仍在继续!我们对2011-2023年这12年的专利活动进行了分析,几乎完整地呈现了深度学习专利活动的显著演化。现代意义上的深度学习概念约在2011年形成,自那时以来,该领域已出现了 311,000个专利族。
在我们之前的研究中(图中浅蓝色曲线所示),深度学习专利活动的快速增长已经令人印象深刻,尤其是在技术浪潮初期,年增长率接近 50%。
最新趋势: 截至2023年,尽管增长速度略有放缓,但仍然保持了显著的增长态势:2019-2023年的年均复合增长率(CAGR)为16%。在快速变化的IT领域,这种超过十年的持续创新动能极为罕见。这表明,深度学习不仅仅是一项独立的技术,而是推动一系列创新和应用的基础性技术。
其中,大型语言模型(LLM) 是这一技术革命的突出成果。得益于深度学习的进步,LLMs迅速崭露头角。从图中橙色曲线可以看出,与LLMs相关的专利族申请始于2020-2021年,并迅速增长。
2. 发明的起源
中国在深度学习竞争中的领先地位优先权国家数据为专利战略提供了重要洞见,也是判断研发活动主要发生地的可靠指标。大多数申请人倾向于首先在本国申请优先权专利。不过,为了更细致地分析,还需考虑国际专利族(IPFs) 的数量(定义见附录)。
国际专利族(IPFs): 是指专利权人选择向国外扩展的专利族,代表了专利的商业价值和国际关注度。这个指标有助于减小因国内政策支持本地申请而产生的偏差,是评估专利战略和商业潜力的宝贵工具。
- 中国的优势地位:2023年,中国占全球深度学习专利申请总量的80%,并占国际专利族的40%。
- 美国的战略重点:尽管仅占全球总申请量的5%,但美国贡献了35%的国际专利族,稳居第二。
中国在人工智能领域的领导地位得益于以下几个关键因素:
- 庞大的国内市场:为技术创新提供丰富的应用场景。
- 政策刺激与战略引导:政府的支持和产业布局推动了技术发展。
- 良好的市场生态:自给自足的供应链支撑了创新生态系统。
与此同时,韩国 的专利申请量和国际专利族数量均显著增长,显示出强劲的上升势头。欧洲 和 日本 也保持了重要的影响力,但在这一竞争激烈的领域略逊于中美韩。
3. 主要玩家
自2021年我们的上一份报告发布以来,深度学习领域专利申请的排名相对稳定,这表明主要玩家的地位正在巩固。领先的实体通过显著扩展其专利组合继续巩固其优势:
- 百度:专利族从2,500增长至6,751,增长了45%,在总量和国际专利族数量上均排名第一。
- 三星:增长了27%,在国际专利族数量上排名第二,是领域内的重要玩家。
- 平安科技:在专利族数量上排名第四,在国际专利族数量上排名第三。
- 谷歌:专利族数量排名第九,国际专利族数量排名第四。
- 微软:专利族数量排名第十,国际专利族数量排名第五。
- IBM:专利组合增长了28%,专利族数量排名第六,国际专利族数量排名第九。
- 腾讯:专利族增长了38%,但在国际专利族排名中位列第十。
- 中国国家电网(SGCC):专利族总量庞大,但主要集中在中国,没有国际专利族。
中国高校的作用:中国的高校在创新生态系统中继续扮演重要角色,在深度学习领域拥有可观的专利组合,但主要集中于国内,国际专利族比例较低。
- 中国科学院:自2021年以来扩展了17%。
- 浙江大学:增长了15%。
- 北京工业大学:增长了43%。
- 哈尔滨工业大学:以64%的增长率居首。
缺席的科技巨头:尽管一些科技巨头(如亚马逊、Meta(Facebook)和苹果)在技术行业中占据主导地位,但它们在深度学习领域的专利申请量相对较低。这并不意味着这些公司缺乏对深度学习的投入,而是它们更倾向于通过收购人工智能初创公司来扩展其技术能力。
4. 结论
深度学习领域的知识产权保护竞争激烈全球深度学习专利竞争的激烈程度突显了知识产权保护在这一变革性领域中的战略重要性。各国和国家联盟必须培养关键玩家,并建立创新友好的生态系统以保持竞争力。
- 中国的优势:以市场规模、政府支持和自给自足的供应链为核心的组合,推动了中国在深度学习领域的领导地位。百度凭借强大的专利组合位居首位,其背后是一个强大的高校和研究机构生态系统。
- 其他重要贡献者:美国(IBM、谷歌、微软、英伟达和英特尔)、韩国(三星)、欧洲(博世)和日本(索尼)的持续努力将确保深度学习及其应用的未来充满活力和竞争力。
本文转载自 欧米伽未来研究所,作者: 欧米伽未来研究所