8月16日,中国信通院在可信AI峰会上发布智能文档处理首轮评测结果,阿里达摩院文档智能平台表现优异,成为全国首批获得“可信AI认证”的文档AI产品。文档AI能识别和理解票据、合同、表格等各种复杂文档,是业界公认的高度难技术之一,阿里达摩院已构建出完整的技术栈,持续引领业界方向。
中国信通院从2018 年起开始建设“可信AI”评测体系,逐渐成为国内人工智能权威评测体系,覆盖产品服务能力、应用成熟度和可信风险三大类。今年中国信通院首次针对智能文档处理(IDP)发起评测,通过百余项关键指标进行全方位评估,达摩院文档AI在技术能力、产品能力、应用能力三项上均获得最高的5级评价,表现优异。 信通院指出,达摩院文档AI功能完备,场景丰富,行业覆盖广,且具备较高的准确率、可接受度总体较高。
据介绍,文档AI是OCR(光学字符识别)技术的进一步升级。传统OCR主要针对固定版式下的文字识别,难以应对复杂情况。文档AI能够分析各种随机版式,识别文档中的层级和结构关系,甚至理解复杂的表格…由于任务复杂多样,文档AI需要深度融合自然语言处理和计算机视觉,一直是业界公认的高难度技术之一。
阿里达摩院早在2019年就率先提出基于图模型的多模态文档信息抽取方案,引领业界发展方向;目前已构建出完整的文档AI技术栈,除了文档核心处理技术外,还包括底层的电子文档解析、OCR以及自学习平台。同时,达摩院还在探索下一代文档智能技术,提出了多模态文档理解模型Bi-VLDoc,首次通过不同模态信号交叉监督、不同模态强制混合注意力,实现了视觉-语言的双向精准对齐,在业界四个代表性的文档理解数据集中均取得最佳模型效果(SOTA)。
达摩院在四个代表性数据集上创造了新SOTA
据了解,达摩院文档AI支持合同、票据、报表等各种文档内容的自动识别、提取、分类、整合及校验,已广泛应用于海关、法律、医疗、金融等行业,是企业数字化的重要支撑技术之一。以海关报关业务为例,它在上海、宁波等五大港区落地,让企业报关人员免去了繁复的手工录入。相关系统运行两年多来,已处理超过两百万票报关业务,为报关企业提效3.5倍。此外,达摩院文档AI还应用于盲文识别,将盲文翻译成汉字和数字,已落地浙江省盲人学校,助力普惠教育。
AI自动生成报关单
AI翻译盲文数学试卷
据介绍,阿里巴巴持续重点投入文档AI在内的人工智能前沿研究。国际权威研究机构Gartner最新的《云AI开发者服务关键能力报告》显示,阿里巴巴在语言AI领域排名全球第二,创下中国企业最好成绩。