IT领导者权衡AI在改善数据管理方面的作用

人工智能
在当今从电子商务到非营利组织的各个领域,如何有效利用企业数据资产已成为成败关键。机器学习和GenAI虽然在推动技术创新中扮演重要角色,但其应用必须经过审慎评估,以确保投资回报。

从电子商务到非营利组织,利用企业数据资产已成为组织成败的关键。机器学习和GenAI是其中的一部分,但掌握它们的应用需要评估AI对业务的实际影响。

AI已成为企业的流行语,机器学习(ML)和GenAI也成为了更大讨论的一部分,特别是CIO的角色必须相应适应。以总部位于阿姆斯特丹的国际电器零售协会Euronics为例,其数字总监Umberto Tesoro的工作始于如何更好地利用数字数据来提升客户体验并增加销售额。

Gartner建议扩展数据和分析战略,以涵盖AI,并避免缺乏治理的分散化举措。GenAI在Euronics的战略中是数据和分析的一个特殊案例,负责这些工作的CIO或CDO必须理解何时适用GenAI,何时不适用。

事实上,Euronics目前并未实施GenAI技术,因为Tesoro认为它没有适合零售活动的应用场景。他表示:“IT必须为业务服务。”

管理团队的第一步是聘请一位用户体验(UX)设计师,不仅为终端用户设计界面和体验,还通过测试提供定性和定量的证据,以指导网站和应用的性能优化。

Tesoro解释道:“电子商务是一段从访问网站到完成购买的旅程。我们监控整个流程,并利用汇总的数据来评估带给客户的最佳解决方案和体验。我们总是为消费者提供两种不同的体验,并评估结果,然后,我们选择其中一种,并对网站体验进行任何必要的调整,因此我们的电子商务战略完全基于数据驱动。”

网站的解决方案由ML增强,帮助提供个性化内容,推荐与客户已购买产品相关的商品。对于ML和分析,Tesoro会在市场上购买他认为最佳的产品,然后通过技术合作伙伴根据公司网站和应用的需求进行定制。

他说:“内部IT团队必须能够管理和引导供应商,但我们不进行内部开发。在我们的情况下,我认为这不太合适。我为供应商和合作伙伴提供方向和战略,内部的项目经理则充当链接。对于我们来说,数字团队的关键人物是UX设计师和业务分析师,因为我们内部专注于战略目标:客户体验和支持销售的数据分析。”

正是对公司数据资产的重视以及不断提升客户体验的目标,促成了Euronics与商业媒体公司Criteo的合作,以在其电子商务网站上实施Criteo的零售媒体解决方案。

Tesoro表示:“我们为消费者提供与他们在网站上的具体搜索相匹配的产品。对我们来说,这有多重好处:我们为广告商提供了更好的结果,并为某些产品在我们电商平台上销售创造了条件。通过分析Criteo平台提供的消费者搜索意图数据,我们对销售产生了积极影响。”

数据在非营利组织中的价值

即便对于意大利的非政府组织Emergency,数据也是需要加强和保护的战略资产。

Emergency的CIO Manuele Macario表示:“数据是医院核心活动的支持,必须始终确保我们治疗对象的数据安全。”

这一理念促使我们在阿富汗的三个Emergency外科中心启动了一个管理临床数据的信息系统,该系统基于SDC软件平台运行。其架构基于开源组件构建,无论是服务器还是分布在各Emergency诊所的平板电脑,都是使用开源技术的。

Macario表示:“这款开源软件平台由我们的医疗部门开发,目的是创建一个即便在不稳定的条件下也能正常工作的记录系统。”举例来说,它能够适应没有互联网连接的环境并支持离线工作,当网络恢复时,数据会重新传输。该系统易于安装,我们还可以将它部署到其他地点。”

尽管如此,这仍然是一个非常先进的临床数据收集系统,因为它是数字化的、实时的,而且安全性很高,因为数据通过VPN加密后传输到Emergency位于米兰的中央数据中心。在那里,使用Microsoft Power BI进行数据分析。Macario解释道,这一基础设施是本地部署的,目的是保护已有的投资,但这并不排斥使用云技术。实际上,近几年我们已采取了一些步骤,将部分服务迁移到云端。

“数据管理中最重要的是拥有一个稳健的灾难恢复计划,”Macario说,“对于像我们这样的非政府组织来说,安全问题既包括网络安全,也包括物理安全。因为我们不仅是攻击的目标,还在战争区域运营,那里的服务并不总是可靠的,一旦发生故障,硬件替换零件也很难找到。”

为应对这些问题,我们应用了创新的加密技术和地理数据备份技术,特别是不可变的云技术,这能有效防止勒索软件的攻击。这些还得到了AI技术的支持,用于终端保护。用户身份通过Azure Entra ID平台管理,该平台集成了AI,能够实时警告可疑活动。

数据管理的转折点

但Emergency真正利用AI技术实现突破的是在阿富汗开展的Amanat项目中应用的GenAI,这个项目基于八年前对超过1000万份病历的扫描工作。

该项目的下一步是利用数字化数据进行分析。由于这些扫描的数据来自创伤医院的文件,往往因医护人员匆忙书写,字迹潦草且不规范,因此这些数据无法被软件直接读取。

Macario表示:“我们求助于大型科技公司解决这个问题,LLM算法带来了转折点,因为它们使我们能够进行分析。”这些分析结果被我们的医疗部门用来分析医疗服务的获取情况和提高质量,获取统计数据,创建档案,并帮助我们理解在战争环境下需要哪些器材、药品和医生,这些数据为我们提供了一个科学基础,帮助我们评估干预措施的效果,并报告战争对平民的影响。”

随后,Macario的团队启动了一个概念验证(PoC)项目,随机选取了2002年至2018年间喀布尔创伤医院的一千份病历进行测试。这一概念验证是为了测试技术的有效性并控制成本,因为如果将系统应用于所有文档,成本将显著增加。

“我们选择了Microsoft和Azure OpenAI技术作为我们的合作伙伴,”他说,“我们不希望将病历数据放在开放的OpenAI-ChatGPT系统中。因此,我们使用了我们Microsoft租户上的空间,这为我们提供了患者数据的隐私和保护保障。”

微软的技术为Emergency团队提供了计算能力,但团队需要定制Azure Document Intelligence算法,通过训练使其识别医疗记录中的格式,并帮助AI理解应解析哪些信息以及如何解析。

在此基础上,创建了一个可搜索的关系数据库,从中可以对活动进行事后分析以捕捉趋势。为了读取数字化的病历,Macario的团队设计了特定的提示,插入Azure OpenAI系统中,以便获得如缩略语的展开或仅解释部分书写的单词等信息。

“我们提取了从受伤到接受医院治疗之间的时间信息,这是理解我们急救中心的布置是否合理以及我们的手术是否有效的关键,”Macario解释道,“通过正确的提示,我们引导Azure OpenAI修正并转换这些信息,为我们提供了可分析和可视化的数据。”

对GenAI的合理投资

Macario强调,GenAI只有在投资回报合理时才应该应用。

“我不认为我们应将AI和大型语言模型(LLM)应用到不必要的领域,否则在成本和对环境的负担方面,技术将变得不可持续,”他说,“对我而言,AI和GenAI应用于无法通过其他手段获得的结果,或者因为预期的利益显著。我们的Amanat项目正是如此,它不仅为我们的运作提供了有用的数据,还为未来在战争背景下的最佳干预做好准备,并能以数据展示战争带来的后果。”

Euronics的Tesoro对GenAI也持谨慎态度,该公司目前并未将其应用于零售业务,但正在Salesforce生态系统中进行测试,以了解其在提高生产力方面的可能用途。在这方面,前景看起来很有希望。

“我目前认为GenAI不会对我们的业务产生重大影响,但我感兴趣的是将其用于自动化手动流程,我们已经在测试GenAI工具,以处理重复且无附加价值的任务,”Tesoro说道,“对我来说,AI是赋能人们的工具,帮助他们避免在机械任务上浪费才华,而是将精力转向提升智力能力的工作。”

Macario重申,在Emergency的Amanat项目中,ChatGPT的任务范围非常明确。“它是一个工具,不是一个神谕,必须设定界限,明确其应该做什么,”他说。“算法通过统计数据发声,它们不会给出正确或错误的答案,而是给出一个具有不同程度可靠性的结果,然而,低于某个门槛,答案是不可接受的。在概念验证项目中,我们筛选了一千份病历,最终淘汰了一半,因为它们的结果不可靠。”

不要忘记传统AI

数据与分析专家Stefano Gatti指出,GenAI确实有帮助,但还不够成熟,无法管理面向客户的服务。“不过,它足够成熟,可以支持提高内部生产力,许多CIO对此已有共识,”他说,“人类的监督,或者至少对结果可靠性的验证,仍然是至关重要的。”

Gartner也持类似观点,认为CIO们应首先理解用例是否能为业务创造价值以及是否具备实际可行性,然后再投资GenAI,因为很难证明不加区分地应用GenAI是合理的。此外,还有一些更为成熟的传统AI技术,如优化、仿真和知识图谱,它们无需GenAI也能有效应用,并且风险更低。

责任编辑:华轩 来源: 企业网D1Net
相关推荐

2024-10-08 10:34:26

2014-02-18 10:31:57

Informatica主数据管理

2024-01-02 11:12:25

2013-11-28 13:58:24

Informatica主数据管理

2024-01-10 16:21:37

2022-08-17 08:48:07

IT领导者现代化

2020-04-28 08:32:55

情感AI人工智能AI

2023-08-22 10:47:07

人工智能AIGCOpenAI

2020-11-03 15:05:08

华为云大数据管理

2021-01-22 10:26:27

IT领导者技术领导者CIO

2011-11-15 19:10:53

SAP数据集成SAP TechEd

2023-07-11 15:02:34

数据丢失人工智能

2022-12-27 10:26:55

2013-12-25 11:28:54

Informatica数据脱敏

2015-03-13 09:05:26

Teradata数据仓库数据管理

2024-02-26 10:02:48

Gen AI人工智能智能家居

2023-04-17 16:40:12

能源管理绿色数字化转型

2020-06-05 14:48:35

数据中心数据管理网络

2019-04-29 15:17:40

甲骨文数据管理
点赞
收藏

51CTO技术栈公众号