Analytics Vidhya 近日发布了GitHub上3月份最热门的5个数据科学和机器学习项目,本月的名单从Google Brain的AstroNet到人造神经网络可视化工具,这都是非常棒的项目,相信一定可以扩展你的机器学习视野。
1、Person Blocker
Person Blocker 是一个python库,可以使用预先训练好的神经网络自动屏蔽图像中的所有人。该算法底层实现是在 MS COCO 数据集上预训练的 Mask R-CNN,但它不需要 GPU!此外,它不仅可屏蔽人像,还可以屏蔽包括长颈鹿和汽车在内的多达 80 种不同类型的物体,包括车辆,动物,电子小配件等。(项目地址:https://github.com/minimaxir/person-blocker)
2、AstroNet
早在2017年12月,Google Brain团队就透露Astronet应用发现了2颗新行星 - 它是处理天文数据的深层神经网络模型。这是一个巨大的发现,它展现了机器学习在当今世界产生的深远影响。
现在,Google Brain已经发布了该技术的全部代码,并且已经将它提供给所有人。该模型基于卷积神经网络(CNN)。(项目地址:https://feedburner.google.com/fb/a/mailverify?uri=Avbytes)
3、ANN Visualizer
ANN Visualizer是一个python库,它使我们能够使用一行代码就可视化人工神经网络。它用于与Keras一起工作,并利用python的graphviz库创建一个整洁和可视化的图形,用来表示你正在构建的神经网络。(项目地址:https://github.com/Prodicode/ann-visualizer)
4、Fast Pandas
熊猫是为数据科学家和开发人员提供的最灵活和***大的工具之一。非常灵活,人们可以通过几种方式执行特定的任务。该项目旨在针对这些情况下的不同可用方法进行基准测试; 此外,在numpy和pandas中都有专门的功能部分。(项目地址:https://github.com/mm-mansour/Fast-Pandas)
5、TensorFlow.js
TensorFlow.js 是一个开源硬件加速 JavaScript 库,用于训练和部署机器学习模型。TensorFlow.js 的 API 灵活且直观,可以使用低级的 JavaScript 线性代数库和高级图层 API 在浏览器中定义、训练和运行完整的机器学习模型。(项目地址:https://github.com/jimfleming/tensorflowjs)
6、Caffe64
Caffe64是一个简单,小巧但功能非常强大的神经网络库。Caffe64被认为是最容易编译的库和最轻量级的神经网络库。(项目地址:https://github.com/dfouhey/caffe64)
7、TensorFlow Hub
TensorFlow Hub是一个用于促进机器学习模型的可重用部分发布、发现和使用的库。它提供了模块,这些模块是预先训练好的TensorFlow模型,可用于新任务。通过在相关任务上重用模块,你可以:
- 用较小的数据集训练模型
- 改进泛化
- 大大加快了培训(项目地址:https://github.com/tensorflow/hub)