极限元:彰显技术实力 抢滩人工智能高地

新闻
智能交通是未来交通系统的发展方向,如何避免交通事故的发生、提高车辆的运行安全,是智能交通系统亟待解决的问题。目前,由于疲劳驾驶引起的交通事故在全国所有交通事故中占据很大的比例,因此,研究有效、可行的疲劳驾驶检测系统尤为重要。

   有人表示,2016年的人工智能=1996年的互联网=1976年的PC,更有人预测,人工智能将会是比移动互联网大一千倍的市场,下一个BAT级的公司或许就从人工智能里面产生。”未来的人工智能会细化方向,会有越来越多的专业公司出现,而一家大公司一统江山的局面会逐渐打破。“极限元(北京)智能科技股份有限公司CTO车浩博士对记者说。

  车浩于中国科学院自动化研究所模式识别专业博士毕业,国家重点实验室助理研究员,先后参与多项国家级项目(863、国家自然科学基金),曾担任校企合作项目宝马汽车人机交互查询系统、三星葡语语音合成系统、联想手机语音合成系统负责人;其“高表现力语音合成技术”曾获北京市科技进步二等奖,主要研究方向为语音合成与识别、多模态人机交互、计算机视觉等方向。

[[174880]]

  作为极限元联合创始人的车浩,首先在智能语音技术上破冰,而后在计算机视觉和虚拟现实等技术上取得卓有成效的发展,获得多项专利并得到业内广泛认同,不断巩固着极限元在人工智能领域的领先地位:

  一、智能语音平台 为行业用户提供深度语言定制化解决方案

  极限元智能语音平台围绕自身的语音平台优势,为开发者提供多种API接口,系统集成商、解决方案提供商、软件开发商等合作伙伴可通过标准接口方便快捷地将极限元智能语音平台能力集成到各种应用系统中,方便开发者轻松快速构建有声世界。让语音技术在生活、医疗、教育、家居、安防、金融、互联网等行业得到更多应用,这些应用每日为数以百万计的移动互联网用户提供流畅的语音服务。

  同时,语音平台支持大词汇量连续语音在线识别,在云计算平台下,借助深度学习方法DNN和自然语言处理使识别准确率可达99%以上,而识别延时仅为0.1倍时长。

  在声纹识别方面,99%以上的超高识别准确率确保安全,其场景是提取说话人的语音身份特征进行身份验证,主要应用于安防。快速便捷的注册算法,高速识别保证效率、深度的语义理解、特定场景的语义解析技术,融合依存句法分析、信息抽取,将安全和便捷省时完美结合统一。

  智能语音平台在教育方面的应用就更广泛了,极限元为语文出版社定制的口语评测功能,参考标准示范发音,对口语发音的效果进行客观评测。其支持音素、字词、语句、段落等多个维度的测评,包括准确度、流利度、节奏、韵律、语流等多项指标都可进行技术统计,在普通话、方言、英语、中文古诗词等多语种都可进行学习评测。

  车浩表示:”目前极限元智能语音平台有上万的用户规模,处于培养用户使用习惯的阶段,不断提升极限元智能语音平台系列产品性能,更在加快研制智能语音芯片,力争为客户提供一站式服务,将便捷化、个性化的服务推向极致。“

  二、互联网音、视频有害信息审查安全网关

  极限元开发了国内首次结合语音和视频两个维度的安全网关。双管齐下的力度,保证了审查的准确率和效率,也是对客户安全需求和成本双重考虑。

  1、大数据与深度学习相结合:极限元拥有大数据样本集合,前期的图像样本采集工作扎实到位,数千万张的大数据样本,让有害信息无所遁形。图像识别领域最新的卷积神经网络和长短时记忆模型相结合的深度学习框架、GPU与CUDA相结合的训练与识别框架,让错判率和漏判率大幅降低。

  2、图形+语音双深度学习检测引擎技术:采用共享式网络结构,多个神经网络共享,加强语音与图像的深度学习极大提高检测效率。在语音识别技术上运用马尔可夫统计模型,该模型是实现快速精确的语音识别系统的最成功的方法,基于马尔可夫模型的检测机制大幅降低误报率。

  3、智能化监控数据抓取机制:全自动智能化监控数据抓取机制,网络底层部署自动数据获取模块无需用户再推送,免去客户二次开发烦恼。监测数据根据报警等级自动调节信息获取频率,在节省带宽的同时保证准确率。

  三、车载疲劳驾驶检测仪

  智能交通是未来交通系统的发展方向,如何避免交通事故的发生、提高车辆的运行安全,是智能交通系统亟待解决的问题。目前,由于疲劳驾驶引起的交通事故在全国所有交通事故中占据很大的比例,因此,研究有效、可行的疲劳驾驶检测系统尤为重要。

[[174882]]

  极限元提出一种面向智能交通的疲劳驾驶检测系统解决方案,采集超过50万名司机的大数据,基于面部特征对车内驾驶员的面部疲劳状态进行监控,根据人眼及其嘴部状态判断驾驶员是否疲劳。

  对于车内监控区域视频,采用直方图均衡化滤除光照强度变化带来的影响,利用基于Viola-Jones提出的人脸检测算法离线训练的人脸模型对人脸进行粗略检测,定位出多个近似于人脸的区域,并提取区域的hog特征,然后采用线性svm算法对上述特征进行分类,最终准确定位人脸位置。基于核函数相关滤波算法对当前帧人脸rect进行有效追踪;随机梯度下降算法提取人脸面部特征,将人眼连续多帧闭合,或者嘴部连续多帧张开等状态作为判断是否疲劳驾驶的依据,覆盖绝大部分疲劳驾驶场景。

  人工智能作为计算机领域的概念已经发展了六十余年,从近几年开始它慢慢从实验室爬出来,在方方面面渗透我们的生活。在未来几年,我们应该可以看到更多的实例化的人工智能产品和创业公司涌现出来。

责任编辑:张燕妮 来源: 51CTO
相关推荐

2018-01-02 10:18:37

云计算

2021-02-02 10:53:37

人工智能

2022-12-01 07:03:22

语音识别人工智能技术

2022-11-28 09:18:03

2022-06-26 23:16:29

元宇宙人工智能VR

2021-03-02 14:19:30

人工智能根技术“十四五”

2022-08-30 12:58:49

元宇宙

2017-08-18 11:10:00

人工智能金融科技

2022-12-05 07:17:14

人工智能语音合成

2022-12-08 14:47:15

人工智能元宇宙

2023-10-20 09:42:43

人工智能元宇宙

2022-12-15 07:35:04

人工智能语音应用场景

2020-12-24 15:56:01

人工智能人机对抗技术

2015-05-29 21:28:46

人工智能京东大数据

2017-06-30 09:52:00

人工智能社交数据

2022-12-13 07:19:00

声纹识别人工智能障碍

2021-01-11 14:18:56

人工智能技术

2021-12-22 11:15:03

人工智能技术云计算

2021-12-04 22:00:37

人工智能AI

2022-11-22 14:52:27

人工智能机器学习
点赞
收藏

51CTO技术栈公众号