2024年大数据行业预测（四）-51CTO.COM

生成式人工智能将很快从膨胀预期的顶峰走向幻灭的低谷。委婉点，即现在有很多关于生成式人工智能的炒作。然而，所有这些炒作意味着，对于某些组织来讲，采用这项技术更多的是为了“跟上潮流”，而不是因为其是组织试图解决的特定问题的最佳解决方案。因此，我们很可能会看到大量资金投资于失败的生成式人工智能项目，从而陷入幻灭的低谷。这是一个闪亮的新物体，许多首席信息官和其他高级领导人可能会感到压力，因为他们已经有了一个生成式人工智能程序。限制这些失败项目的关键在于，确保组织了解使用生成式人工智能的具体原因，其与定义的业务成果相关，并建立了衡量投资成功的方法。–Rex Ahlstrom，Syniti首席技术官兼副总裁

生成式人工智能将引发高管之间的冲突，因为其会争夺企业内部议程的控制权：近一半的高管表示，其人工智能投资明年将增加，以赶上生成式人工智能的潮流;而70%的高管已经处于生成式人工智能探索模式。现在，各组织正在加大人工智能在企业中的采用力度，每位高管都希望成为带领企业踏上人工智能之旅的人。到2024年，人工智能议程将变得更加复杂，因为从首席技术官到首席信息官，再到数据分析高管，越来越多的参与者进入这个领域，以获得控制权。高管层将需要确定其人工智能机会在哪里，以及必须与不同部门进行哪些对话，以决定由谁来领导。与此同时，首席信息官们正面临着来自首席执行官的压力，要求其扩大对生成式人工智能的使用。2024年，随着战斗的继续，我们将看到首席信息官们继续推进其探索性人工智能实验和项目。–Alon Goren，AnswerRocket首席执行官

小型、专业化的大型语言模型将战胜庞大的通用模型。正如我们在“大数据”时代所看到的那样——越大越好。模型的“获胜”不是基于其拥有多少参数，而是基于其在特定领域任务上的有效性及其效率。企业将拥有自己的重点模型组合，而不是拥有一两个大型模型来统治所有模型，每个模型都针对特定任务进行微调，并最小化规模以降低计算成本并提高性能。–Nick Elprin，Domino Data Lab联合创始人兼首席执行官

生成式AI将重点转向结构化企业数据：企业将拥抱使用生成式AI从结构化数字数据中提取见解，增强生成式AI在从图像、视频、文本和音频生成原始内容方面的传统应用。生成式人工智能将坚持自动化数据分析，简化模式、异常和趋势的快速识别，特别是在传感器和机器数据用例中。这种自动化将增强预测分析，使企业能够主动响应不断变化的条件、优化运营并改善客户体验。–Nima Negahban，Kinetica首席执行官兼联合创始人

人工智能驱动的人类质量翻译将使生产力提高10倍甚至更多：2023年初，每个人都认为仅LLM就能产生人类质量的翻译。在这一年里，我们发现了LLM翻译中的多个差距，从幻觉到英语以外语言的表现欠佳。与云存储或服务一样，人工智能质量翻译的成本越来越高，翻译几乎所有内容的ROI变得有吸引力，为那些使用人工智能进入全球市场的企业创造了竞争优势。与人们普遍认为语言服务行业将在2024年萎缩的观点相反，随着更多内容的本地化，该行业将会增长，但成本更低。2024年将是翻译成本直线下降的一年。由语言AI和AI驱动的语言质量保证提供支持的翻译人员的工作效率可提高10倍甚至更多。–Bryan Murphy，Smartling首席执行官

尽管2023年人们对人工智能(AI)的出现进行了大肆宣传，其看似具有无限的潜力，但在医疗保健领域，我们已经开始看到基于规定性、大型语言模型(LLM)的解决方案在提供临床建议和见解方面的局限性。到2024年，我们预计临床医生在人工智能方面越来越成熟，他们将寻求方法来减轻接受基于法学硕士的解决方案的规定性建议的潜在风险，而不是选择提供循证和可解释建议的负责任的人工智能解决方案。随着焦点转向负责任的人工智能，寻求将创新人工智能技术融入其组织的临床工作流程的医疗保健领导者将需要了解这些工具的工作原理。依赖于获得许可的LLM的解决方案无法为个体患者的护理提供量身定制的建议，因为这些解决方案基于数百万个数据点，没有具体强调个人。这些解决方案的“黑匣子”性质缺乏个性化关注和“可解释性”，这将强调临床医生在决策中拥有最终决定权的必要性。因此，我们预计2024年将出现自然分裂：现有的提供临床建议的解决方案将越来越多地基于特定数据，并为人工智能生成的见解提供证据。相比之下，旨在支持临床医生编写文档和就诊总结的解决方案，严重依赖于自然语言生成，将受益于通用LLM的使用。–Ronen Lavi，Navina首席执行官兼联合创始人

虽然人工智能和LLM持续受欢迎，但潜在的危险也随之增加：随着人工智能和LLM在2023年迅速崛起，商业格局发生了深刻的转变，其特点是创新和效率。但这种快速上升也引起了人们对敏感数据的利用和保护的担忧。不幸的是，早期迹象表明，数据安全问题明年只会加剧。如果得到有效的提示，LLM擅长从培训数据中提取有价值的见解，但这带来了一系列独特的挑战，需要现代技术解决方案。随着2024年人工智能和LLM的使用继续增长，平衡潜在收益与降低风险和确保负责任使用的需求至关重要。如果不对AI访问的数据进行严格的数据保护，数据泄露的风险就会增加，从而可能导致财务损失、监管罚款和严重损害了组织的声誉。组织内部还存在内部威胁的危险风险，受信任的人员可以利用人工智能和LLM工具进行未经授权的数据共享，无论是否恶意进行，都可能导致知识产权盗窃、企业间谍活动和组织声誉受损。来年，组织将通过实施全面的数据治理框架来应对这些挑战，包括数据分类、访问控制、匿名化、频繁审计和监控、监管合规性以及一致的员工培训。此外，基于SaaS的数据治理和数据安全解决方案将在保护数据方面发挥关键作用，因为其使组织能够毫无障碍地将数据融入到现有框架中。–James Beecham，ALTR首席执行官

生成式AI和大语言模型(LLM)的炒作将开始消退：毫无疑问，GenAI是一次重大飞跃;然而，许多人严重高估了实际的可能性。尽管生成的文本、图像和声音看起来非常真实，似乎它们是经过深思熟虑和像人类一样对准确性的渴望而创建的，但它们实际上只是统计上相关的单词或图像的集合，这些集合很好地组合在一起。但实际上，可能完全不准确。好在，如果终端用户充分考虑人工智能的所有优点和局限性，那么人工智能的实际输出将非常有用。–Ryan Welsh，Kyndi创始人兼首席执行官

因此，到2024年，组织将迎来对GenAI和LLM可以给其业务带来的真正限制和好处的现实检查，评估的结果将重新调整这些技术的战略和采用。供应商需要让终端用户清楚这些好处和限制，因为其对人工智能创造的任何东西都持适当的怀疑态度。必须考虑准确性、可解释性、安全性和总成本等关键要素。来年，GenAI领域将为企业带来一种新的范式，在这种范式中，企业只需要在生产中部署少量基于GenAI的应用来解决特定的用例。

矢量数据库：随着人工智能从头开始构建新应用，以及LLM集成到现有应用中，矢量数据库将在技术堆栈中发挥越来越重要的作用，就像过去的应用数据库一样。当团队寻求创建具有新的LLM支持功能的人工智能产品时，将需要可扩展、易于使用且操作简单的矢量数据存储。–Avthar Sewrathan，Timescale总经理

LLM提供商之间的竞争：大型语言模型(LLM)的格局正在升温。OpenAI及其GPT-4 Turbo一直处于领先地位，但其他企业如Anthropic的Claude、Google的Gemini和Meta的Llama也紧随其后。OpenAI最近的管理层动荡，尤其是Sam Altman的事件，为这些竞争对手提供了机会，并有可能在某些领域超越OpenAI。–Tomer Borenstein，BlastPoint,Inc.联合创始人兼首席技术官

当组织意识到没有灵丹妙药时，生成式人工智能将达到幻灭的低谷。毫无疑问，生成式人工智能的使用将在2024年继续呈爆炸式增长。然而，如果许多组织对其效益实现的速度的期望不切实际，或者没有专业知识来有效地实施和使用，可能会对生成式人工智能的性能感到失望。到2024年，我们预计会看到生成式人工智能的幻灭低谷。这并不是说生成式人工智能失败了。这仅仅意味着生成式人工智能解决方案需要更多时间才能达到预期的结果。–Cody Cornell，Swimlane联合创始人兼首席战略官

人们对矢量数据库的兴趣将会激增，但这种兴趣不会持久：矢量数据库将成为许多人讨论的热门新领域，但几年后最终将被关系数据库吸收。每隔10年左右，就会有一种“新”数据库技术被宣布为关系数据库的终结，而开发人员跟随这一潮流只是为了重新发现关系模型非常灵活，并且关系数据库供应商可以很容易地将新技术应用到其产品中。以PostgreSQL的pgVector为例，了解当今关系数据库如何处理矢量数据，以及为什么能够忽略围绕专用矢量数据库的炒作。pgVector和PostgreSQL能够快速支持围绕矢量数据的这一用例——该项目于2021年启动，但今年随着对生成人工智能和矢量数据的所有兴趣，其发展得很快。对于那些考虑这个领域并考虑在其项目中实现开源组件的人来说，pgVector使PostgreSQL成为一个显而易见的选择。–Dave Stokes，Percona技术员

企业正在加快投资，以保护员工的生成式人工智能，以及整体人工智能投资：对技术的投资正在增加，甚至超过了对办公空间的投资。人工智能或许带来了当今所有类别中最大的增长潜力，但也带来了一些最大的风险。企业将投资抓住人工智能优势，同时积极缓解和解决其风险因素。随着生成式人工智能在工作场所发挥作用，雇主正在投资指导方针、风险缓解技术和参数，特别是在保护企业信息免受“未知”风险因素影响时。McKinsey 2023年的一份报告指出，据报告采用人工智能的企业中有60%正在使用生成式人工智能。WalkMe认为，这个数字将继续增加，就像云和互联网的采用一样。同一份报告发现，生成式人工智能的两个最大风险是不准确和网络安全。我们预计这些问题将会升级，随着技术状况的改善，企业应对风险的能力将会提高。–Uzi Dvir，WalkMe首席技术官

越来越多的组织开始涉足生成式AI，并更广泛地增加对机器学习的投资。对于想要在云平台上运行机器学习作业的平台团队来说，这面临着许多运营挑战。MLOps是目前的热门话题，但仍处于采用的早期阶段——随着越来越多的组织成熟其ML基础设施，我们将看到该领域的进步。–Malavika Balachandran，Tadeusz高级产品经理

LLM过渡到更小的模型以提高可访问性：虽然LLM的通用性令人印象深刻，但其需要大量的计算和存储来开发、调整和使用，因此对于绝大多数组织来说，成本可能过高。只有拥有丰富资源的企业才有能力获取这些资源。由于需要找到一条使其在经济上更加可行的道路，我们应该期望看到能够使其使用去中心化和民主化的解决方案。我们应该预见更多、更集中、更小、功耗更低的型号，将更容易为更广泛的用户所使用。这些重点模型也应该不易受到LLM经常遭受的幻觉影响。–Naren Narendran，Aerospike首席科学家

关于数据所有权的讨论将会升温：随着大型语言模型(LLM)变得更加强大和复杂，关于数据所有权的争论将会越来越激烈。与我们在开源代码中看到的情况类似，关于大企业如何使用其不拥有的数据来训练模型的讨论正在进行中，这可能导致权力集中在少数大企业手中。为了解决这个问题，我们将看到新的数据许可框架。这些框架应确保数据所有者因其数据的使用而得到公平的补偿，并确保用户能够以负责任和合乎道德的方式访问和使用数据。–Bob Friday，Juniper Networks首席人工智能官

是否投资人工智能聊天机器人：我们知道，Z世代通常寻求数字形式的沟通，而不是通过电话与人交谈，对于客户服务请求尤其如此。需要注意的是，这一群体希望其媒体和技术能够形成一种共生关系，支持联系、参与和实用性;当其看到良好的客户体验时，便会知晓，并且会避免任何不佳的体验。组织正在投资生成式人工智能功能，以吸引人们在应用上停留更长时间，并推动Z世代用户进行更多活动。这是正确的举措，如果做得正确，可以产生巨大的影响。组织不会仅仅通过创建更好的聊天机器人来获得成功，因为Z世代渴望真实的联系和实用性，而这是难以复制的。如果聊天机器人可以为用户提供新的体验、建议和其他有用的服务，那么其可能会增加特定应用或品牌网站上的活动。话虽如此，用户可能会对GenAI机器人持怀疑态度和谨慎态度，组织需要展示渐进的胜利，以增强聊天机器人的安全性和价值。–Robin Gomez，Radial客户服务创新总监

虽然2023年是生成式AI突破的一年，但由于数据障碍，供应链行业在采用上落后了——只有3%的组织报告使用生成人工智能进行供应链管理。手动、纸质流程仍然主导着全球贸易，因此许多供应链企业一直在努力统一不同来源的大量非结构化数据。然而，解决了这一数据问题的企业，将使2024年成为生成式人工智能供应链突破之年。随着生成式人工智能模型被训练成供应链专家，全球供应链将变得更加自主、自我修复和自我优化。例如，生成式人工智能可以告诉托运人有关异常情况(由于极端天气导致发货延迟)、如何处理(重新路由到更可靠的位置)，甚至最终执行解决方案。通过告诉企业需要将精力集中在哪里，这些人工智能创新将使全球品牌能够提供更好的客户体验，并以最低的成本和对环境的影响来发展业务。–AJ Wilhoit，project44首席产品官

生成式人工智能主导了今年的话题，这是有充分理由的——其将在2024年显著成熟并扩大规模。生成式AI的大量应用目前正处于实验阶段，并有望不断发展。真正的价值在于，其能够帮助人们理解各种内部用例中的非结构化信息——解析大量文档，生成更简洁和信息丰富的摘要，并促进与这些文档的问答交互，从而确保跨多个领域的一致性。除此之外，LLM界面和基于文本的界面将成为几乎每个软件产品的组成部分。这些界面将用于一切，从控制应用到回答用户对应用本身的查询。我们开始在企业网站中看到这种面向消费者的元素。此外，在接下来的一年里，我们可以期待看到一个向更小、更专业的LLM的转变，从而减少培训所需的数据量。这种转变与更广泛地推动开源解决方案相一致，特别是可以证明信息源谱系的模型。–Michael Curry，Rocket Software数据现代化总裁

生成式AI和AI编码助手将通过嵌入式环境从一些人所谓的“初级开发人员”级别(代码接受率为25-30%)提升到CTO级别。添加更多上下文(包括运行时上下文)的能力将以指数方式增加价值，并大幅提高人工智能生成代码的接受率(70%或更高)。更深入一层……目前，深度调试、多文件更改、使用大文件作为输入等活动超出了大多数编码助理的范围。—Elizabeth Lawler,AppMap首席执行官

GenAI将推动转型：2024年，GenAI将推动各个领域的转型，使其变得更加紧迫和变革。在定制GenAI代理的帮助下，阅读、组织和清理非结构化数据等任务可以“AI优先”完成，减少了大量的手工工作。GenAI可以从任何地方访问数据，但治理、数据管道和流程对于管理质量、实现结果、评估价值、确定权利和实现合规性仍然是必要的。GenAI与云相结合，可以加速与数据相关的转型计划。此外，GenAI还可以帮助组织超越竞争对手并加速转型，处理财务、税务、法律、IT、合规和其他部门的复杂任务和流程。利用GenAI作为转型催化剂有可能在竞争对手和组织之间造成分歧，未能利用GenAI的组织可能难以与那些利用GenAI的组织竞争。–Bret Greenstein，PwC US数据和人工智能主管

我们如何在业务中使用生成式人工智能?我们是构建还是购买自己的人工智能解决方案?我们如何提高员工的技能以跟上人工智能的步伐?这些问题围绕着所有行业，而不仅仅是科技行业，并指向一个共同的主题：2024年，生成式人工智能将对未来的工作产生重大影响。新技术的引入往往伴随着来自企业领导者的巨大压力，要求其快速部署这些新解决方案。2024年，我们将看到组织意识到其不能再观望。其需要找到全力投入人工智能的方法。在接下来的6-12个月内，我们将看到重大转变，更多组织投资人工智能战略，并找到使用该技术重新构想其工作流程，并提高效率的方法。–Glean，Arvind Jain首席执行官

2023年，企业正在探索人工智能的基础知识，但我们预计2024年对定制人工智能模型的需求将激增。尽管GPT-4等LLM拥有丰富的知识，但将其应用于新领域仍会带来挑战。为了解决这一知识差距，我们预计“知识注入”将会增加，其中LLM与特定领域的数据集成，形成更专业、情境感知的人工智能解决方案。例如，将通用LLM与患者记录合并，可以增强医疗保健行业的整体患者-提供者体验。在商业中，将人工智能与客户交互联系起来，可以提供模型销售领域的专业知识，并使收入团队受益。随着2024年的临近，知识注入等趋势为企业提供了利用LLM和特定数据库来促进创新和增长的机会。–Gong，Omri Allouche研究副总裁

未完，待续…

若想查看“2024年大数据行业预测”相关篇章，请点击：

2024年大数据行业预测(一)

2024年大数据行业预测(二)

2024年大数据行业预测(三)