【51CTO.com快译】当今,不同的行业都在采用人工智能技术来改善各自领域的用户体验。媒体中的人工智能对用户的影响最为显著,在过去两年的大部分时间里,有很大一部分人的媒体娱乐被限制在家里。例如,字幕为全球范围的内容消费打开了大门,打破了长期以来限制用户内容消费的语言障碍。尽管这些新的人工智能解决方案服务看起来很诱人,但在后端,它增加了开发人员的工作难度,他们在处理这项新技术的同时,必须应对一系列全新的挑战。
了解不同的用例
作为一名开发人员,重要的是能够理解给定的业务用例,并在人工智能的帮助下进行相同的操作是否是最佳方法。在媒体行业,像视频字幕和内容推荐系统这样的是能够利用工智能解决的用例。同时,像自动管理工作室所需设备这样的用例在市场上已经有了更好的解决方案,可以利用这些解决方案而不是使用人工智能。对于一些开发人员来说,能够在一开始就做出正确的决定是一个挑战。
训练模型的数据挑战
任何人工智能模型的初步步骤都是获取数据,以训练模型和开发系统的决策能力,这是最关键的方面之一,因为它决定了 AI 系统决策过程的基础。对于人工智能媒体,这些数据可能与用户在特定流媒体平台上观看的内容有关。获取这种训练数据的高质量数据集给开发人员带来了一系列挑战。
- 首先,由于围绕客户数据的隐私法不断变化,能够获取数据(在媒体行业中与用户数据有关,例如某个流媒体平台的收视模式等)可能很困难。特别是如果需要将 AI 应用于构建一个新的功能,那么就需要花费大量的精力才能找到可用于训练模型的数据。由于有关公司不道德地使用客户数据的新闻,各国的限制越来越多,因此数据稀缺成为了一个主要问题。
- 其次,即使成功提取了这些数据,开发人员面临的下一个挑战是能够确定要发送的正确数据集,作为模型训练的输入发送。需要通过确定哪些数据实体作为不必要或罕见的异常值保留,哪些作为不必要的值放弃,从而高效地清理数据。数据是人工智能的核心,因此,确定合适的数据集是整个系统的关键要素,这对开发人员来说是一个不可否认的挑战。
围绕数据存储和安全的挑战
媒体行业的数据就是大数据的一个很好的例子。例如,Netflix 拥有约 1.51 亿订户和一个相当大的数据库,这也意味着开发人员用于不断改进人工智能系统决策的数据也相当大。数据的高利用率给开发人员带来了两个阶段的挑战。第一阶段是能够创建一个有效的系统来管理和存储大量数据。随着云计算的出现,许多开发人员更喜欢将数据存储在云中,而不是本地存储。这将我们引向第二阶段,即确保数据具有适当的数据安全机制,因为此类大型数据存储是网络骗子的热门目标,如果忽视,可能会对业务造成严重破坏。
围绕一体化的挑战
对于大多数组织而言,旧系统已经到位,需要替换或新开发的 AI 驱动的解决方案集成。这不仅意味着开发人员需要了解其组织的遗留系统是如何工作的,而且他们还需要花费精力寻找一种方法来弥合不同因素之间的差距,这些因素在所使用的遗留解决方案和人工智能解决方案之间差异很大(例如,计算速度、效率等,同时还确保维持整个流程在逻辑上和实际上可行)。此外,许多开发商还需要解决或使用过时的基础设施,并尽可能利用现有资源实现最佳效。
围绕技能和知识的挑战
对于开发人员来说,需要越来越胜任有能力的技能来处理与 AI 相关的开发。具备基础知识的人仍然可以实现小规模的用例,但具有高度扩展数据的现实项目,类似于媒体行业的项目需要一套在该领域具有丰富经验的熟练技能,并且需要开发人员不断提高技能,以了解并接触 AI 行业的最新发展、方法、趋势等。人工智能系统所涉及的计算的绝对复杂性要求开发人员获取知识,以便能够在多个环境中部署这些解决方案,使其具有可移植性,能够权衡可用的不同框架,选择最适合其用例的框架,等等。
结论
媒体行业对于人工智能驱动解决方案有着巨大的空间,新的使用案例不断出现,越来越多地被媒体平台采用。同时,这也给开发人员带来了很多挑战,他们需要提高技能以保持在市场中的相关性,处理获取和管理数据的主要现实场景,并且能够提取模式并识别学趋势,这有助于在整个媒体行业扩大人工智能的使用。
【51CTO译稿,合作站点转载请注明原文译者和出处为51CTO.com】