文本分析是一门强大的学科,能够发现和注释客户意见的每个示例,而不用考虑客户采用哪一种语言。
对于正在意识到围绕其业务具有大量非结构化数据的企业高管来说,人工智能在文本分析方面不受语言限制的可能性是一个至关重要(但很容易被忽视)的问题。
毕竟,非结构化数据(UD)并不是以电子表格等格式结构化的数据,通常是在各种社交媒体、博客、网站评论、呼叫中心电话、私人聊天等的大量数据——而这些数据对于有兴趣改善客户体验(CX)的企业来说意味着具有更多价值的大量资源。
大多数数据都是非结构化数据。根据麻省理工学院的估计,如今80%~90%的数据是非结构化数据,并且正在快速增长。而这一事实意味着,客户的所有意见都可以供那些投资于技术和专业知识的企业进行整理和分析。
这是文本分析人工智能发挥的作用。这导致在任何平台上对企业品牌发表评论的每一位客户都可以前所未有地了解他们的想法、观点和想法。它可以让企业准确而快速地发现优先解决的客户痛点,从而减少客户流失。
鉴于这种普遍性,认识到语言不可知论的价值就显得尤为重要。将分析和注释仅限于英语的观点(当其他观点存在时)会破坏非结构化数据的规模和这种文本分析的普遍性。
因此,有必要了解多语言人工智能分析的工作原理,以及其收集客户意见综合概述的潜力。
自然语言处理的力量
人工智能驱动的文本分析的基础是机器学习(ML)和自然语言处理(NLP)的结合。
机器学习是一种旨在模仿人类学习的人工智能方法。虽然传统的编程需要执行人类创建的规则,但机器学习使用数据分析来学习可用于推断的极其复杂的模式,这使得机器学习非常擅长解决问题和执行复杂的任务。
与此同时,自然语言处理(NLP)属于处理语言。实际上,它可以理解为是机器学习支持的复杂任务之一。
在这种情况下,自然语言处理(NLP)的用途是多种多样的。它可以用于更简单的目标,例如计算给定的术语或单词在文本中出现的频率。或者可以承担更艰巨的挑战,即确定给定文本的情绪甚至情感。
显然,这两者对于希望详细了解所有可用客户意见的企业都有很大的用处。
自然语言处理(NLP)的这些用途使企业能够评估大量数据,以发现他们的品牌在网上或线下被谈论的频率,以及了解是积极的还是消极的评论,还是与一系列更细微的情绪有关。
多语言的方法
至关重要的是,这种方法的好处在于其包含所有客户意见的能力——文本分析适用于每种意见,而不是样本或选择。
然而,为了实现这一目标,不能限制表达给定意见的语言,而是需要人工智能完全与语言无关,特别是如果一家企业是跨国组织的话。
可以通过使用无监督和有监督的机器学习来实现这一点。监督机器学习意味着所涉及的算法由人类对训练数据进行注释“训练”,在涉及大量数据(也称为大数据)的任务时,人工智能可以比人类做得更好。
为了确保满足所有语言的需求,研究人员利用了一个由大约300名以各种语言为母语的人员组成的团队,他们对非结构化数据进行阅读、理解和人工注释。例如,确定某条推特是正面还是负面的,其主题是否存在讽刺意味,甚至是电子邮件或聊天消息的内容所暗示的客户旅程。
一旦人工智能接受母语训练(不需要翻译成英语和使用英语的机器学习模型)以非常准确地实现其目标(无论是建立情绪还是识别主题),其结果可以很容易地使用英语可视化,以客户可以理解的语言为客户体验(CX)专业人员、客户保留经理等解锁所有客户的意见。
最重要的是,人工智能精度还可以不断提高。例如,当一个人用某种情绪对一小部分推文进行注释时,就可以衡量其准确性。可以看到80%~90%或更多内容与算法匹配,无论这些推文是用什么语言写的。
考虑到表达情感的主观性,这表明这些人工智能技术已经变得多么强大。
在非结构化数据中大海捞针
非结构化数据(UD)无处不在,它代表了一个了解所有客户意见的机会,而不是像民意调查那样,根据定义只能提供基于样本的客户意见。
然而,为了真正实现这种不受限制地获取消费者意见的能力,跨国公司不仅需要聘请人工智能专家和技术人员,还需要确保他们的人工智能系统在所有相关语言的数据上都得到与英语相同的高精度训练。
这样一来,文本分析不仅与源无关,而且与语言无关。让企业领导可以自信地断言,他们对客户的观点、痛点和收获点的理解是详细、精确以及全面的。