GenAI对企业具有变革性的力量,例如,营销团队使用GenAI大规模生成定制内容,客户服务团队与智能聊天机器人协同处理复杂查询,产品开发团队依靠这些算法构想新产品,此外,后台办公室也在使用GenAI来简化操作并降低成本。
超过一半的消费者已经体验过AI,然而,尽管关于AI将改变未来工作的宣传铺天盖地,现实与投资回报率之间仍存在巨大的差距。Gartner最近的数据表明,几乎一半负责实施AI的IT领导者在证明其实际商业价值时遇到了问题。
许多企业领导者正在学习的一个重要教训是,算法固然重要,但它们的效用取决于可用的数据。许多公司错失了巨大的财务机会,因为将其专有的非结构化数据与GenAI算法结合使用非常困难。非结构化数据——发票、合同、财务报告、内部维基、电子邮件、幻灯片和在业务过程中创建的所有其他内部知识——占企业数据的80%到90%。更重要的是,内部数据以每月63%的速度增长!这些数据可以用于多种应用。
• 客户端领域的GenAI解决方案使客户能够轻松导航网站并获得客户支持。
• GenAI应用可以改善营销内容的个性化,同时降低内容创建成本。
• GenAI工具正在增强人力资源自动化,加快手动招聘工作和员工流动处理时间。
• AI增强的供应链工具自动化流程,减少资源需求并提高周期时间,从而降低每张发票的成本。
• GenAI加速的审查使合规性更高效,减少了识别和解决问题所花费的时间。
• GenAI还被用于加快产品发现,使其更快速且更具成本效益。
然而,尽管ChatGPT已推出一年半之久,专有的非结构化数据仍未得到充分利用,原因很简单:非结构化数据 notoriously 难以转化为GenAI算法可用的格式。
开发GenAI应用的原型很简单,但开发人员在从原型转向生产时经常会遇到数据预处理和数据工程的挑战。传统的抽取-转换-加载(ETL)工具不适用于不符合列和行格式的数据。
过去十年间,企业中的一个隐秘事实是,将任何企业的非结构化数据——尤其是PDF或幻灯片等自然语言数据——导入先进算法是极其困难的。准备专有数据的技术极其耗费人力且非常脆弱。如今,这是企业在采用GenAI技术时的一个关键瓶颈。尽管非结构化数据非常丰富,但最终,所有类型的非结构化数据都需要统一聚合、处理并集成到下游系统中。没有必要的专业知识、合适的工具和以数据为中心的思维,这个关键步骤往往会陷入困境。幸运的是,数据管理和处理工具的格局正在迅速发展,使得克服与非结构化数据相关的障碍成为可能。
成功驾驭这一转型需要公司采用以使非结构化数据适应GenAI为基础的GenAI数据策略,他们需要投资于GenAI原生的预处理工具,并增强数据工程团队的技能,使他们适应用Python而不是SQL,以及用向量数据库和知识图谱而不是数据湖的新时代。
企业中的AI开发仍处于初期阶段,但Gartner分析师预测,到2027年全球AI软件支出将膨胀至近3000亿美元。企业需要时间来真正释放这些算法所承诺的回报,但有一点是确定的:优质数据意味着优质AI,那些在数据策略上积极进取的公司将最有可能推动显著的成本节约和收入增长。