本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。
人工智能顶会NeurIPS举办的AutoDL 2019-2020系列竞赛落幕,来自中国的AI创业公司,斩获冠亚军。
与往年相比,这届竞赛难度进一步加大。
比赛不只局限在单一技术领域,而是要求参赛选手设计开发能解决包括图像、视频、语音、文本和结构化表格数据等多模态、多领域的全自动多标签分类系统,探索自动深度学习技术落地。
历时四个月角逐后,来自中国厦门深度赋智的DeepWisdom团队拿下冠军,并在GitHub上开源。
这不是一个简单的竞赛,不仅在于参赛选手实力强悍,还在于赛题具有挑战性。
中国AI创业公司夺冠
挑战赛一共分为反馈阶段和最终阶段。在反馈阶段,参赛选手基于24个训练数据集,离线开发AutoDL程序,实现训练数据处理、模型结构设计、参数调校等过程。
然后将AutoDL程序代码上传到比赛平台上,通过另外5个线上私有数据集测试,得到程序性能的即时反馈。
在最终阶段,参赛选手的AutoDL程序在无任何人工干预的前提下,通过10个私有数据集进行评估。最终阶段多轮评估的平均排名将决定获胜者。
竞赛采用ALC(Area under ROC Learning Curve)作为评估指标,来对现实场景中低成本、快速应用、高准确率等要求进行模拟。
这对参赛选手的方案提出了一系列的挑战,比如,“如何在不同的数据中自动发现有效信息?”、“如何提高解决方案的通用性?即如何保证解决方案在未知任务中的适用性?”、“如何控制计算和内存成本?”等等。
参赛选手来自清华大学、北京大学、南京大学、卡内基梅隆大学、首尔大学、弗莱堡大学、汉诺威大学等国内外著名前沿科研院校,以及Google、微软、阿里、腾讯、浪潮等大型科技公司,总计进行了超过2600余次提交。
最后,中国AI创业公司深度赋智双项总分第一,拿下了冠军。亚军和季军也都来自于中国,分别是上海的AI创业公司深兰科技和浪潮。
冠军方案
据深度赋智介绍,其核心技术在于其独立研发的Fully Automatic Machine Learning(Full-AutoML / 全自动机器学习)系统。
这套系统量化了AI生产的所有环节,可以全自动、端到端地生产全流程AI,能摆脱以往的AI设计需要诸多人类经验、难以快速落地的约束。
一名人类AI工程师需要在单个领域进行持续数年的学习、摸索,随着接触数据集的增多、掌握技巧的增多、对整体流程的积累,才能在单个领域下获得较好效果。
与人类AI工程师类似,Full-AutoML需要接触较多的学习任务,以掌握在不同任务上的共性与特异性技巧。
其中,MetaAI子系统模拟了人类AI工程师的学习过程,通过观察已有任务的数据流形与策略效果,以进行全自动的探索性优化。
经过观察,MetaAI可以很好地总结不同任务知识,将原本耗时数年的AI构建过程缩短到最短数十秒。
而且,这套系统也具备自动数据探索、自动数据处理、自动特征工程、自动模型搜索、自动模型设计、自动模型压缩、自动超参优化、自动集成等多项核心组件,内含Few-shot Learning小样本学习、Weakly supervised learning 弱监督学习、Transfer Learning迁移学习、Ensemble Learning集成学习等多类特性。
从而能较好地处理本次竞赛涉及的包含结构化和非结构化数据分类任务。
目前,这套系统已经被深度赋智落地,核心产品自动信息分发系统AutoDist(包含自动搜索系统AutoSearch、自动推荐系统AutoRecsys)以及自动决策系统AutoTables已经在相应的场景中发挥出了作用。
来自厦门的AI创业公司
深度赋智成立于2019年,位于厦门,主要是通过AutoDL技术,降低客户的AI开发成本。已经为电商平台提供了落地的AI解决方案。
创始人兼CEO吴承霖出自腾讯,带领团队设计与实现了亿级用户规模、千亿级数据规模的推荐系统、搜索引擎、用户画像、自然语言处理、知识图谱等系统。
2019年11月,公司宣布完成数百万元种子轮融资,由迅雷及远望资本创始人程浩、Flow Capital创始人赖蕴琦以及腾讯系电商卖座网创始人王星投资。
当时,深度赋智拥有近20人的团队,核心成员均为腾讯、Google、百度、华为等前沿公司资深研究员、架构师。
截止目前,深度赋智及其学术团队在协同学习/NAS/深度强化学习等领域发布了100余篇论文。
并在KDD 2019 AutoML/ACML 2019 AutoSpeech/PKDD 2019 AutoCV2/ACML 2019 AutoWSL等顶级国际AI竞赛中,拿下了单项/总分第一。
传送门
冠军方案开源地址:
https://github.com/DeepWisdom/AutoDL