为了能让机器看懂世界 阿里云破了一个世界纪录

云计算
5月18日,全球权威机器视觉算法测评平台KITTI的世界纪录再此被刷新。来自中国的科技公司阿里云将其车辆检测的准确率拉升至90.46%。车辆检测被认为是实现无人驾驶的关键技术,极具挑战。

 5月18日,全球权威机器视觉算法测评平台KITTI的世界纪录再此被刷新。来自中国的科技公司阿里云将其车辆检测的准确率拉升至90.46%。车辆检测被认为是实现无人驾驶的关键技术,***挑战。

(阿里巴巴iDST团队以90.46%的准确率夺得KITTI***)

据了解,此次重大技术突破是由阿里巴巴iDST视觉计算研究员华先胜领导的团队完成。他们提出了基于区域融合决策和上下文相关的多任务深度神经网络,用于复杂场景下的车辆检测任务,重点解决其中多视角,多姿态以及车辆遮挡等问题。

在网络结构设计上,团队利用反卷积操作提高了小目标的召回率,同时拼接了多层特征以融合低层的局部信息和高层的语义信息,提高了边框定位的准确率。在训练过程中,还借鉴了GAN(生成对抗网络)中的对抗训练模式。

华先胜表示,“现在我们已经将这样的技术集成到阿里云ET当中,并在城市大脑中得以应用。它能够帮助城市大脑准确的看懂车流信息,快速的做出全局性判断”。华先胜是视觉识别和搜索领域的***权威学者,曾获选国际电气与电子工程协会院士(IEEE Fellow)、美国计算机协会ACM杰出科学家。

城市大脑是包括阿里云在内的13家企业联合杭州市政府发起的项目,旨在构建一个城市级的人工智能中枢,让城市能够与人类友好互动。这其中分析视频是城市大脑获取信息的关键。

以交通治理为例,通过这项技术,城市大脑通过普通摄像头就可以感知复杂路况下车辆的运行状态和轨迹,对这些数据进行实时分析。基于此,进行多种智能交通优化。在视频数据处理规模上,全球罕有。

在视觉计算领域的持续攻坚,是阿里巴巴“NASA”计划的一部分。该计划聚焦于机器学习、芯片、IoT、操作系统、生物识别等核心领域,他们希望能解决10年、20年后的困难。此前,已在光量子计算机、全浸没液冷服务器等方面取得重大进展。

KITTI是目前国际上***的自动驾驶场景下的计算机视觉算法评测数据集,可以用于评测目标检测等计算机视觉技术在复杂真实环境下的性能。KITTI包含市区、乡村和高速公路等场景采集的真实图像数据,有大量的微小目标、欠曝和过曝、多种视角变化以及各种遮挡情况。

责任编辑:鸢玮 来源: 阿里云
相关推荐

2015-10-28 16:54:07

阿里云云计算

2022-04-08 08:11:28

Python代码

2020-05-14 09:37:37

阿里云AnalyticDBTPC-DS

2018-01-13 22:49:12

阿里巴巴人工智能机器阅读

2009-06-09 09:31:54

魔兽世界吉尼斯世界纪录

2018-08-03 16:09:42

搜狗

2011-06-10 13:53:24

天河一号A

2021-11-15 15:19:11

NVIDIA

2009-04-07 13:55:15

NehalemIntel服务器

2018-07-16 14:53:18

海信

2021-07-09 17:49:46

脑机接口机器人工智能

2011-11-17 13:13:18

戴尔服务器

2011-03-31 10:43:46

甲骨文WebLogic应用服务器

2021-03-22 16:50:56

勒索软件攻击赎金

2023-03-22 15:35:48

新华三

2014-10-23 16:22:05

华为

2014-11-03 16:07:03

华为服务器

2018-07-03 09:37:12

量子计算机编码
点赞
收藏

51CTO技术栈公众号