6月20日消息,魔搭社区与浦数人工智能开放数据平台OpenDataLab达成深度合作,魔搭社区开发者将可直接调用浦数平台上超7000个开源数据集,以高质量数据加速AI大模型研发。
数据和模型的融合是推动AI技术发展的核心动力。整合各类关键资源,构建一个高效、协同的开发环境,成为加速中国AI应用创新的关键。基于这一理念,聚焦开源数据的浦数平台与聚焦开源模型的魔搭社区达成深度合作,实现底层接口打通,共同推动模型与数据的无缝对接,为中国开发者打造从数据获取、模型下载、模型调优到部署应用的一站式开发体验,降低AI创新门槛。
浦数平台OpenDataLab是上海人工智能实验室在WAIC 2022大会上发布的人工智能开源开放体系的核心项目之一,致力于为国产大模型提供高质量的开放数据资源。目前,浦数平台已汇聚7700多个大模型相关的优质、开源数据集,覆盖计算机视觉、自然语言处理、多模态、通用机器学习、音频识别等领域800多种任务类型。
魔搭社区是阿里云2022年牵头成立的AI模型开源社区,在业界首个提出了MaaS模型即服务的理念。经过一年多的发展,魔搭已成为国内最活跃的开源模型社区,也是中国众多大模型开源的首发平台,此前已汇聚4500多款优质模型及上千开源数据集,为超过500万开发者提供模型及免费算力服务。
本次合作后,浦数平台和魔搭社区在数据存储、数据展现、工具链等技术层面,实现了互联互通。用户可以在魔搭社区上直接下载和管理从浦数平台迁移过来的数据集,或在魔搭训练推理框架中直接调用相关数据对模型进行微调。新引入的海量开源数据集,将极大丰富魔搭平台上的数据资源,让开发者选模型、找数据一站搞定。