数据集轻松按需搜索,这个工具有近2000个图像数据集,可免费获取

新闻 机器学习
每个研究机器学习项目的人,似乎都有这样的痛苦。那就是从学术网站、GitHub上寻找到合适的数据集。

 本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。

每个研究机器学习项目的人,似乎都有这样的痛苦。那就是从学术网站、GitHub上寻找到合适的数据集。

但现在,有这样一个网站可以帮你搞定,让AI开发变得更加简单易行。

数据集轻松按需搜索,这个工具有近2000个图像数据集,可免费获取

这个项目名叫BIFROST,一个数据集搜索工具,里面共有1899个图像数据集,还专门设置分类,比如Humans、Geospatial、Autonomous Cars等。

一键搜索,免费获取,直接链接到原始数据库,帮你快速找到合适的数据集。研究团队来自新加坡,Reddit上17小时热度200+。

数据集轻松按需搜索,这个工具有近2000个图像数据集,可免费获取

使用说明

话不多说,我们就直接来上这个网站来试试~

正如刚才所看到的,这个工具是按任务、应用、类别、标签或格式进行分类。

数据集轻松按需搜索,这个工具有近2000个图像数据集,可免费获取

根据「类别」,这个网站共分为18类,比如Humans、Geospatial、Autonomous Cars、Retail、3D等。

数据集轻松按需搜索,这个工具有近2000个图像数据集,可免费获取

向左滑动,选择你需要的类别,一键即可出结果,我们以3D为例,然后就呈现这样的页面。

数据集轻松按需搜索,这个工具有近2000个图像数据集,可免费获取

若以「Humans」为例,界面是酱紫的。

数据集轻松按需搜索,这个工具有近2000个图像数据集,可免费获取

我们也看到,这是按照精选进行排序。除此之外,你还可以选择「最新」、「最多标签数」、「数据集大小」、「图片数量最多」这些分类。

数据集轻松按需搜索,这个工具有近2000个图像数据集,可免费获取

除了「快速检索」之外,还可以根据开发人员的具体需要来进行搜索。

数据集轻松按需搜索,这个工具有近2000个图像数据集,可免费获取

可以选择这些「限定」:任务类型,标签格式,最小图像数量。

其中任务类型主要包括,图像分割,目标检测、图像分类、姿态估计、视觉推理、3D重建、视频分类。

标签格式包括,YOLO、PASCAL、COCO以及Segmentation。

数据集

以COCO为例,这是一个适用于目标检测、图像分割和字幕大型数据集。

界面是这样的:

数据集轻松按需搜索,这个工具有近2000个图像数据集,可免费获取

主要分为图像示例、数据集简介、特性、类别分布四个板块。

在简介部分,可以看到这个数据集的研究团队、一句话介绍,以及通过CC4.0协议的部分,还直接链接到原始数据库论文地址

CC4.0协议是一种知识共享许可协议,是一种允许他人分发作品的公共版权许可,还有一种类似的,MIT协议。

作者此次选择的近2000个数据集都通过了这两项协议的。所以网站并不直接管理这些数据集,它只是一个数据集的「搬运工」。

数据集轻松按需搜索,这个工具有近2000个图像数据集,可免费获取

在「类别分布」这一板块,首先会提示,没有标签、标签过多的图像数量。

数据集轻松按需搜索,这个工具有近2000个图像数据集,可免费获取

然后根据不同的标签类别,显示各自的图像数量分布。

数据集轻松按需搜索,这个工具有近2000个图像数据集,可免费获取

这个项目的负责人名叫Charles Wong ,来自新加坡,目前是Bifrost的CEO。

[[337055]]

本科就读于新加坡科技设计大学,曾参与MIT Global Leadership Program。

接下来,他们的工作将主要集中在这几个方面:

  1. 将网站中的每一个数据集都进行全面分析
  2. 改进搜索方式
  3. 实现用户上传和分享自己的数据集
  4. 生成自己的合成数据集
数据集轻松按需搜索,这个工具有近2000个图像数据集,可免费获取

「Why is our data better?」

就像在网站上介绍到的那样,让你快速、高精度、高准确度地寻找到合适的图像数据集。

感兴趣的朋友,可以戳下方链接去试试哦~

网站地址:https://datasets.bifrost.ai/

 

责任编辑:张燕妮 来源: 量子位
相关推荐

2020-04-02 15:29:43

谷歌疫情COVID-9

2010-06-17 09:29:32

SQLServer 2

2018-06-15 19:41:22

2018-01-17 17:06:27

2023-04-18 18:22:31

开源工具数据库

2021-03-05 13:14:33

微软WindowsWindows 10

2023-08-03 08:15:20

2013-06-20 09:02:51

CocoStudio工cocos2d-x

2023-08-21 14:09:17

2023-12-01 16:23:52

大数据人工智能

2020-03-01 13:55:15

datasetsear免费数据集2500万

2019-03-21 16:27:21

数据开发机器学习

2020-12-17 18:36:50

数据集大规模数据Kaggle

2022-08-22 11:34:42

开源数据

2019-09-29 14:11:46

代码开发GitHub

2020-12-29 10:56:38

恶意软件SoReL-20M网络安全

2023-09-26 08:00:00

人工智能数据集

2020-04-29 13:40:32

数据集数据科学冠状病毒

2019-07-04 19:06:04

技术人工智能大数据

2024-01-31 09:59:43

自动驾驶数据
点赞
收藏

51CTO技术栈公众号