当谈到数据科学和机器学习时,GitHub和Reddit是两个***的平台。前者是代码和项目之间共享和协作的***工具,而后者则是与全球数据科学爱好者交流的***平台。
我们每个月都会盘点GitHub上最***的数据科学和机器学习库,下面我们一起来看看本月上榜的有哪些库:
1、Deep Painterly Harmonization
对图像进行处理并且使处理后的图像看起来像真实图像一样这类技术已经存在很久了。但是通过深度学习去实现将会更加有效率和更加逼真。开发人员提出了一种算法用以实现绘制一幅绘画:在一张图片中添加一个外部元素并使其与之融合,而且看起来几乎与原始绘画风格一样。
正如上面的图像所示-右边第三幅是最终输出,如果我们没有前面的两个图像,我们可能无法区分出气球是一个外部插入对象。这种算法产生比照片合成或全局程式化技术( global stylization techniques)更精确的结果,并且实现迄今为止非常难以实现的处理水平。(项目地址:https://github.com/luanfujun/deep-painterly-harmonization)
2、Swift for TensorFlow
Swift for TensorFlow上个月在TensorFlow开发者峰会上***公布演示。Swift for TensorFlow 为 TensorFlow 提供了一种新的编程模型,为解决现有问题开辟了新的设计机会和新的途径。
据介绍,Swift for TensorFlow结合了图的性能、Eager Execution的灵活性和表达能力,重点提高了堆栈中各个层次的可用性,不过该项目仍处于初始阶段,因此尚未准备好写入深度学习模型。点击查阅更多相关资料:《可以抛弃 Python 了?Google 开源 Swift for TensorFlow》
3、MUNIT
来自康奈尔大学的研究小组提出了一种多模态无监督的图像到图像转换问题的标准框架-(MUNIT)框架,用于将图像从一个域转换到另一个域。通俗来讲,就是拍摄一张图像,并从中产生一个新图像(例如,将狗的图像转换为猫)。
先前存在的方法仅仅可以实现给定图像的一对一映射,因此不能对一个图像产生多个不同输出结果。而MUNIT的另一个激动人心的功能正是可以为一张图片提供多个输出。(项目地址:https://github.com/NVlabs/MUNIT)
4、GluonNLP
GluonNLP 提供了 NLP 领域***深度学习模型的实现,且建立了文本数据管道和模型的模块。设计上,它同样也是为了让工程师、研究员和学生能快速的实现研究思路,做出产品原型。
该存储库有一个很好的文档,以及如何使用该库的详细示例。他们甚至为胶粘剂新手们准备了一个精心打包的60分钟速成课程。(项目地址:https://github.com/dmlc/gluon-nlp)
5、PyTorch GAN
它是研究论文中介绍的GAN(或生成敌对网络)的PyTorch实现的集合。目前存储库列出了24种不同的实现,每种实现都以其独特的方式增加了您的知识。该列表包含Adversarial Autoencoders,CycleGAN,Least Squares GAN,Pix2Pix等实现。(项目地址:https://github.com/eriklindernoren/PyTorch-GAN)