如果你参加过大型的数据科学家职位的面试,你就会发现候选人的背景各不相同,比如软件工程、机器学习、金融、市场营销等等,而且这些面试者基本都拥有一系列属于自己的项目,尽管他可能在数据科学方面的经验还不足。而招聘人员/经理一般也都很欣赏那些手头有一两个优秀开源项目的应聘者。
今天,和大家推荐6个优秀的开源的数据科学项目,对计算机视觉专家的需求每年都在稳步增长,作为一名数据科学专业人士,有很多事情要做,有很多东西要学。希望这6个开源项目对你有所帮助:
1、Few-Shot vid2vid
去年我偶然发现了视频到视频(vid2vid)合成的概念,并被它的有效性所震撼。vid2vid本质上是将一个语义输入视频转换为一个超真实的视频输出。
但是目前这些vid2vid模型有两个主要的限制
- 他们需要大量的训练数据
- 这些模型很难推广到训练数据之外
这就是英伟达viv2vid框架的厉害之处,它可以在分割蒙版、素描草图、人体姿势等多种输入格式上,实现高分辨率、逼真、时间相干的视频效果。
这个GitHub库是一个PyTorch实现,你可以通过以下这篇文章,开始学习如何设计自己的视频分类模型。(文章地址:https://www.analyticsvidhya.com/blog/2019/09/step-by-step-deep-learning-tutorial-video-classification-python/?utm_source=blog&utm_medium=6-open-source-data-science-projects)
Github地址:https://github.com/NVlabs/few-shot-vid2vid
2、Ultra-Light and Fast Face Detector
这是一个超轻版本的人脸检测模型,这个人脸检测模型的大小只有1MB。
该模型设计是针对边缘计算设备或低算力设备(如用ARM推理)设计的,可以在低算力设备中如用ARM进行实时的通用场景的人脸检测推理,同样适用于移动端、PC。
Github地址:https://github.com/Linzaer/Ultra-Light-Fast-Generic-Face-Detector-1MB
3、Gaussian_YOLOv3
我是自动驾驶汽车的超级粉丝,因此,我认为任何有关自动驾驶的框架或算法有新的发展都是值得令人开心的。
目标检测算法是这些自动驾驶的核心,而高精度、快速的推理速度是保证驾驶安全的关键,那么,这个项目有哪些惊艳的特性呢?
Gaussian_YOLOv3架构提高了系统的检测精度,支持实时操作,与传统的YOLOv3相比,Gaussian YOLOv3分别将KITTI和Berkeley deep drive (BDD)数据集的平均精度(mAP)提高了3.09和3.5。
Github地址:https://github.com/jwchoi384/Gaussian_YOLOv3
4、T5
这个名单里怎么能少了谷歌的存在呢,谷歌在机器学习、深度学习和强化学习的研究上投入了大量的资金,他们的研究成果就反映了这一点,你也可以从他们的开源项目里学到很多知识。
在T5这个GitHub存储库中,他们已经开源了数据集、预先训练的模型和T5背后的代码。谷歌提出预训练模型 T5,参数量达到了 110 亿,再次刷新 Glue 榜单,成为全新的 NLP SOTA 预训练模型。NLP是目前最热门的领域,如果你不想错过它的最新成果,最好还是看看这个项目
Github地址:https://github.com/google-research/text-to-text-transfer-transformer
5、KnowledgeGraphData
史上最大规模1.4亿中文知识图谱开源下载,数据是.csv格式的。简单地说知识图谱就是通过关联关系将知识组成网状的结构,然后我们的人工智能可以通过这个图谱来认识其代表的这一个现实事件,这个事件可以是现实,也可以是虚构的。
知识图谱可以应用于机器人问答系统,知识推荐等等,下图为知识图谱在机器人上的应用。
Github地址:https://github.com/ownthink/KnowledgeGraphData
6、roughViz
roughViz.js是可重用的JavaScript库,基于D3v5,roughjs和handy,用于在浏览器中创建粗略/手绘样式的图表。
你可以使用下面的命令在你的机器上安装roughViz:
- npm install rough-viz
你可以通过roughViz生成以下图表:
- 条形图
- 柱状图
- 折线图
- 饼状图
- 散点图
Github地址:https://github.com/jwilber/roughViz