全国首批 阿里达摩院文档AI通过信通院权威评测

人工智能
8月16日,中国信通院在可信AI峰会上发布智能文档处理首轮评测结果,阿里达摩院文档智能平台表现优异,成为全国首批获得“可信AI认证”的文档AI产品。

8月16日,中国信通院在可信AI峰会上发布智能文档处理首轮评测结果,阿里达摩院文档智能平台表现优异,成为全国首批获得“可信AI认证”的文档AI产品。文档AI能识别和理解票据、合同、表格等各种复杂文档,是业界公认的高度难技术之一,阿里达摩院已构建出完整的技术栈,持续引领业界方向。

中国信通院从2018 年起开始建设“可信AI”评测体系,逐渐成为国内人工智能权威评测体系,覆盖产品服务能力、应用成熟度和可信风险三大类。今年中国信通院首次针对智能文档处理(IDP)发起评测,通过百余项关键指标进行全方位评估,达摩院文档AI在技术能力、产品能力、应用能力三项上均获得最高的5级评价,表现优异。 信通院指出,达摩院文档AI功能完备,场景丰富,行业覆盖广,且具备较高的准确率、可接受度总体较高。

据介绍,文档AI是OCR(光学字符识别)技术的进一步升级。传统OCR主要针对固定版式下的文字识别,难以应对复杂情况。文档AI能够分析各种随机版式,识别文档中的层级和结构关系,甚至理解复杂的表格…由于任务复杂多样,文档AI需要深度融合自然语言处理和计算机视觉,一直是业界公认的高难度技术之一。 

阿里达摩院早在2019年就率先提出基于图模型的多模态文档信息抽取方案,引领业界发展方向;目前已构建出完整的文档AI技术栈,除了文档核心处理技术外,还包括底层的电子文档解析、OCR以及自学习平台。同时,达摩院还在探索下一代文档智能技术,提出了多模态文档理解模型Bi-VLDoc,首次通过不同模态信号交叉监督、不同模态强制混合注意力,实现了视觉-语言的双向精准对齐,在业界四个代表性的文档理解数据集中均取得最佳模型效果(SOTA)。

达摩院在四个代表性数据集上创造了新SOTA

据了解,达摩院文档AI支持合同、票据、报表等各种文档内容的自动识别、提取、分类、整合及校验,已广泛应用于海关、法律、医疗、金融等行业,是企业数字化的重要支撑技术之一。以海关报关业务为例,它在上海、宁波等五大港区落地,让企业报关人员免去了繁复的手工录入。相关系统运行两年多来,已处理超过两百万票报关业务,为报关企业提效3.5倍。此外,达摩院文档AI还应用于盲文识别,将盲文翻译成汉字和数字,已落地浙江省盲人学校,助力普惠教育。

AI自动生成报关单

 

AI翻译盲文数学试卷

 

据介绍,阿里巴巴持续重点投入文档AI在内的人工智能前沿研究。国际权威研究机构Gartner最新的《云AI开发者服务关键能力报告》显示,阿里巴巴在语言AI领域排名全球第二,创下中国企业最好成绩。


责任编辑:赵立京 来源: 阿里云
相关推荐

2022-04-22 11:22:47

达摩院阿里巴巴

2022-07-18 11:20:58

存储

2020-11-02 22:05:01

华为云GaussDB云原生

2018-04-20 09:08:10

AI芯片阿里巴巴

2024-11-07 15:26:35

2021-07-29 18:53:38

计算

2020-08-26 13:18:19

AI 数据人工智能

2020-01-02 11:19:55

阿里巴巴2020科技趋势5G

2020-12-29 09:36:57

科技趋势阿里

2022-07-19 14:01:44

阿里达摩院AI

2021-08-24 15:58:24

AI 阿里人工智能

2019-01-03 09:18:37

AI数据科技
点赞
收藏

51CTO技术栈公众号