二次元少女生成器、会开车的神经网络...2019年优秀的17个机器学习项目-二次元生成器

为了挑选出2019年最好的开源项目，最近某位Medium网友整理了2019年Reddit机器学习板块热门高赞项目资源汇总，一起来看看都有哪些项目上榜：

1. 无监督图到图的转换(913赞)

英伟达的研究科学家刘洺堉等人，发明了一个称为 FUNIT (Few-shot Unsupervised Image-to-image Translation)的小样本非监督图像转换模型，只需少量样本(几张照片)，就能将一张新图片中的一些姿势、五官分布等特征转换到这些样本图上。赋予AI 可以媲美人类的“脑补”能力：“看几眼”新物种，便能“推测”出新物种某些(与新图片一致的)动作姿势，就像有人第一眼看到独角兽，便能想象它怎样奔跑。

GitHub地址：https://github.com/NVlabs/FUNIT

2. 自动生成二次元妹子(512赞)

作者提出了一种能够绘制动画的人工神经网络。

通过Waifu自动贩卖机你可以选择自己喜欢的角色，生成自己喜欢的动画。

地址：https://waifulabs.com/

3. 机器学习中最大的数据集资源列表(499赞)

作者整理了一个机器学习数据集相关的列表集合，可用于机器学习实验。

这种资源可以减少你在线查找数据集的时间，该数据集根据不同的用途/领域划分，包括：CV、NLP、自动驾驶、QA、音频和医疗。你还能根据许可证类型进行划分。

地址：https://www.datasetlist.com/

4. “烂番茄”上的48万条影评(464赞)

作者在“烂番茄”上搜罗了48万条影评，这些评论在自然语言处理任务中非常有用。

GitHub地址：

https://github.com/nicolas-gervais/6-607-Algorithms-for-Big-Data-Analysis/blob/master/scraping%20all%20critic%20reviews%20from%20rotten%20tomatoes

该数据集还可在Google云端硬盘上找到。

地址：https://drive.google.com/file/d/1N8WCMci_jpDHwCVgSED-B9yts-q9_Bb5/view

5. 使用ML创建一个猫门，当猫嘴里叼着猎物时会自动锁门(464赞)

这关于一个使用机器学习创建的猫门。

视频中，作者制作了一扇猫门，如果猫的嘴里有东西，门就会自动锁上15分钟，这样猫就没办法把死掉的动物叼进房子里，他将摄像头连接在猫门上，然后用机器学习判断猫嘴里是否有东西。

地址：https://youtu.be/1A-Nf3QIJjM

6. Neural Point-Based Graphics(415赞)

作者提出了一种新的基于点的复杂场景建模方法。它使用原始点云作为场景的几何表示。然后用一个可以学习的神经描述编码扩展每个点。局部几何形状和外观利用神经描述编码，通过将点云的栅格化从新的视点通过深度渲染网络来获得新的场景视图。

论文地址：https://arxiv.org/abs/1906.08240

7. AdaBound优化器(402赞)

AdaBound是一个优化器，它有一个现成的PyTorch实现，adample在模型训练开始时表现得像Adam，并在最后转变为SGD。保证模型收敛到损失更低的最优解上。

Github地址：https://github.com/Luolc/AdaBound

8. 第一个在德州扑克中击败人类的AI(390个赞)

来自Facebook研究的帖子:“Pluribus是世界上第一个能够在六人无限德州扑克游戏中击败人类的人工智能机器人。这也是人工智能机器人首次在超过两个人/团队参与的复杂游戏中击败顶级人类玩家。

Pluribus之所以成功，是因为它可以非常有效地处理两名以上玩家的不完美信息博弈挑战。它使用自我对战来教自己如何取胜，没有任何示范或策略指导。

官方地址：

https://ai.facebook.com/blog/pluribus-first-ai-to-beat-pros-in-6-player-poker/

9. 各种ML模型的NumPy实现(388个赞)

numpy-ml是一个不断更新的机器学习模型、算法和工具的集合，专门用NumPy和Python标准库编写。

GitHub地址：https://github.com/ddbourgin/numpy-ml

10. PyTorch实现的17种Deep RL算法(388个赞)

作者给出了17种深度强化学习算法的PyTorch实现。其中的一些实现包括DQN，DQN-HER，Double DQN，REINFORCE，DDPG，DDPG-HER，PPO，SAC，离散SAC，A3C，A2C。

GitHub地址：https://github.com/p-christ/Deep-Reinforcement-Learning-Algorithms-with-PyTorch

11. 100万可供下载的AI生成人脸(373个赞)

作者用NVIDIA的StyleGAN生成了100万张脸，正如你所看到的，这些图像看起来和真人一模一样。

下载地址：https://archive.org/details/1mFakeFaces

12. 教神经网络驾驶赛车(358个赞)

作者设计了一个游戏能够教神经网络驾驶汽车，它是一个简单的网络，具有固定数量的隐藏节点并且没有偏差。然而经过短短几代的训练后，它就能把汽车开的又快又安全。

视频地址：https://www.youtube.com/watch?v=wL7tSgUpy8w

13. 将ML模型转化成本地代码(345赞)

这是一个轻量级的库，它提供了一种简单的方法来将经过训练的统计模型转换成原生代码(支持Python、C、Java、Go、JavaScript、Visual Basic、c#)。”目前支持以下模型：

Github地址：https://github.com/BayesWitnesses/m2cgen

14. 探索神经网络的损失情况

摘自作者的帖子：“该帖子是关于在神经网络的损失面中找到不同的模式。通常，围绕最小值的场景看起来像是一个坑，周围是随机的丘陵和山脉，但是存在着更有意义的坑，如下图所示。

“我们发现你几乎可以找到自己喜欢的任何landscape的最小值。有趣的是，找到的横向模式即使对于测试集也仍然有效，即，它具有一种很可能对于整个数据分布仍然有效的属性。”

论文地址：https://arxiv.org/abs/1910.03867

15. 基于GPT-2的Reddit机器人

作者基于OpenAI的GPT-2驱动构建了一个Reddit机器人。

你可以通过回复任何带有“ gpt-2 finish this”的评论来使用这个回帖机器人。

Github地址：https://github.com/shevisjohnson/gpt-2_bot

16. Super SloMo：一个可以将任何视频转换为慢动作视频的CNN(332个赞)

这是由英伟达提出的一种算法，可以将30帧视频变成240帧的慢动作视频，有人用PyTorch实现了这个算法。

Github地址：https://github.com/avinashpaliwal/Super-SloMo

17. NLP预训练模型库(206个赞)

这是用于NLP的预训练transformer模型的开源库。该项目汇总了基于Transformer的各种最新的NLP-2、RoBERTa、XLM、DistilBert、XLNet等。

Github地址：https://github.com/huggingface/transformers