在数据隐私保护条例不断完善、国家大举培育数据要素市场、数据流通持续改善的今天,IDC首次发布中国人工智能基础数据服务市场追踪报告。报告预测,到2025年,中国人工智能数据采标服务市场规模将达到123.4亿元人民币。市场的发展驱动力一方面来源于人工智能市场的迅猛发展,另一方面来源于行业用户加大数据采集力度。
市场构成
从用户需求来看,人工智能基础数据采标服务市场需求主要来源于自动驾驶——包括车内驾驶舱以及车外道路环境感知等场景、AI技术提供商和智能安防。此外,互联网行业、智能终端行业也依然是AI基础数据服务的投资主体。随着传统行业对人工智能技术的引入,金融、医疗、工业领域也开始在垂深场景的AI应用中引入数据采标服务。发展到现在,市场对于AI基础数据服务的需求已基本清晰:标注质量要高、标注效率要快、知识经验要多、数据安全有保障、整体成本具有较高性价比。
市场生态
当前人工智能数据服务市场的产业链并不冗长,市场参与主体(下图所示)主要为已成规模的数据标注服务商。当然,在数据标注平台背后,还存在诸多提供数据采标服务的小型团队。随着传统行业开始自研AI,传统的人力资源服务商也开始参与市场竞争。随着市场的竞争,规模化效应将更加突出——成规模的平台型厂商将占据越来越高的市场份额。
市场格局
根据IDC追踪的人工智能基础数据采标服务市场规模,在2020-2021H1的市场格局中,百度在中国AI基础数据服务市场持续保证市场份额第一;其次是海天瑞声。其他值得关注的厂商包括云测、Appen、龙猫数据、数据堂、标贝数据等。
展望未来,人工智能行业发展不断涌现出新技术新趋势,例如联邦学习、大模型等都对AI基础数据采标服务提出新要求:
数据采标需求范围更广:数据采标服务需满足的AI应用场景比以往明显更加广泛。
数据标注精度要求更高:在自动驾驶等诸多场景中,为进一步提升AI系统的准确度,要求数据标注精度不断提升。
交付效率要求更高:快速变化的市场环境要求企业必须提高研发效率,进而对AI基础数据的交付效率也提出更高要求。
数据标注复杂度提升:随着AI应用场景日益融合、复杂,对数据标注的难度和复杂度也带来了一定的挑战。有经验有实力的企业才能适应这一市场变化。
数据安全相关风险:根据法律规章的更新要求,及时调整现行业务开展方式、数据安全管理体系等。
标注人员培养模式转变:过去通过扶贫、再就业、产学研等方式快速降低了人工标注的成本,需要进一步探索职业教育、优化标注工具。
IDC中国助理研究总监卢言霞表示:“ 市场竞争瞬息万变,引入AI基础数据服务有助于帮助企业快速进入AI模型开发。在选择外部数据采标服务时,确保基础的数据安全保障的同时,亦应多考虑标注质量、标注效率、知识经验的积累,也应考虑为AI构建专有数据集管理系统。”