2019 年 Reddit 机器学习板块关注度最高的 17 篇帖子，你看过吗？

显示全部楼层 · 2024-6-25 00:23:19

2019年将要过去。国外最热峰会Reddit的机器学习蓝筹股，也为你们提供了一个优秀的学习讨论场所。

那么，在过去的一年Reddit上关注度最高的贴子有什么呢？

一位来自南非的数据分析师，总结了机器学习蓝筹股上点赞数最高的17篇项目、论文和Demo，希望你能从这种贴子中获得启发。

无监督图到图的转换（913赞）

这是来自英伟达的研究，它让AI也可以像人类一样，只需少量的样本，即可实现从图象到图象的转换。

相关报导：

《雷布斯变猫布斯，皮卡丘变狗卡丘：英伟达最新AI开源，万物换脸只凭一张图 | Demo》

该模型通过结合对抗训练方案和新颖的网路设计来实现这些快速生成能力。

比如，我们有了一张兔子的动图，和其他不同植物的静态图象，FUNIT才能得到动作与之同步的各类动图。

GitHub地址：

生成自定义二次元姑娘（521赞）

作者提出了一种才能勾画动画的神经网路Waifu自动贩卖机，其特征是可以让你更具需求生成自己喜欢的二次元姑娘，并在此基础上生成你喜欢的动画。

网站地址：

最大数据集资源列表（499赞）

作者汇总了一系列机器学习数据集，减少你们在线查找数据集的时间。数据集按各类任务或领域进行细分，包括：NLP、自动驾驶、质量检测、音频和医疗等等。

网站地址：

48万条用于NLP的影评（464赞）

这是作者在影片评论网站“烂番茄”上搜集的48万条评论，对NLP任务十分有用。

GitHub地址：

%20all%20critic%20reviews%20from%20rotten%20tomatoes

你也可以到Google网盘上直接下载：

自动猫门（464赞）

这是一个给猫奴们的福利。如果猫的嘴巴叼着东西，猫们将手动锁定15分钟，防止猫将死老鼠等东西带进房子。

这个装置将摄像头联接到猫的门上，然后应用机器学习来检测猫的嘴巴是否有东西，来做到这一点。

视频地址：

基于点云生成3D场景图（415赞）

作者提出了一种基于点的新方式来对复杂场景进行建模，它使用原始点云作为场景的几何表示。

然后，该方式使用可以学习的神经描述编码扩展每位点，神经描述对局部几何形状和外形进行编码。通过将点云的栅格化从新视角传递到深度渲染网路中，可以获得新的场景视图。

论文地址：

AdaBound优化器（402赞）

这是两个中国本科生提出的一种新的优化器，他们分别来自清华和复旦。这篇文章早已被ICLR 2019收录，并且让领域主席赞不绝口。

相关报导：

《中国学霸本科生提出AI新算法：速度媲美Adam，性能抗衡SGD，ICLR领域主席赞不绝口》

AdaBound兼具了模型训练中的速率和性能。

在模型训练开始时，AdaBound的行为类似于Adam，速度很快，并在结束时转换为SGD，保证模型收敛到损失更低的最优解上。

论文介绍：

代码实现：

AI在德州扑克中战胜人类（390赞）

由Facebook提出的Pluribus，是第一个才能在六人无限注德州扑克中击败人类专家的AI机器人。这也是AI第一次在超过两个或两个团队的复杂游戏中打败顶尖人类玩家。

相关报导：

《AI赌神超进化：德扑六人局击败世界冠军，诈唬如神，每小时能赢1千刀 | Science》

Pluribus之所以成功，是因为它可以十分有效地处理两名以上玩家的不完美信息博弈挑战。它使用自我对战来教自己怎么获胜，没有任何示范或策略指导。

官方介绍：

各种ML模型的NumPy实现（388赞）

numpy-ml是机器学习模型、算法和工具的集合。这些模型、算法和工具专门用NumPy和Python 标准库编撰。

GitHub地址：

17种Deep RL算法的PyTorch实现（388赞）

作者给出了17种深度加强学习算法的PyTorch实现。包括的个别实现包括DQN，DQN-HER，Double DQN，REINFORCE，DDPG，DDPG-HER，PPO，SAC，离散SAC，A3C，A2C等等。

GitHub地址：

100万张AI生成的假脸（373赞）

作者使用英伟达的StyleGAN生成了100万张假脸，这些假脸和真人对比上去几乎无异。

下载地址：

赛道周围的神经网路赛车（358赞）

作者设计了一个小游戏，教神经网路驾驶车辆。

这是一个简单的网路，具有固定数目的隐藏节点（没有NEAT），并且没有误差。然而经过短短几代的训练后，它早已能成功让车辆快速安全地行驶。

视频地址：

将ML模型转化成本地代码（345赞）

一些边沿设备硬件很简单，比如只有单片机，无法安装深度学习软件库，怎么办？

m2cgen提供了解决办法，它是一个轻量级的库。m2cgen提供了一种简便的方式将经过训练的ML模型转换为本地代码，支持Python，C，Java，Go，JavaScript，Visual Basic，C#等语言。

相关报导：

《没有依赖库也能跑机器学习模型！推荐一个强悍工具m2cgen》

m2cgen当前支持的模型如下：

图片:

GitHub地址：

探索神经网路的损失情况（339赞）

这篇贴子是关于在神经网路的损失曲面中找到不同的纹样。通常，围绕最小值的地图看起来像是一个坑，周围是随机的丘陵和山脉，但也存在更有意义的坑，如下图所示：

作者发觉我们几乎可以找到自己喜欢的任何奇怪地图的最小值。有趣的是，找到的地图虽然对于测试集也依然有效，因此它很有可能对于整个数据分布依然有效。

论文地址：

源代码：

基于GPT-2的Reddit发帖机器人（343赞）

作者建立了一个基于GPT-2的Reddit发帖机器人。可以通过回复任何带有“ gpt-2 finish this”的评论来使用这个发帖机器人。

源代码：

将任何视频配准成慢动作（332赞）

这是由英伟达提出的一种算法，可以将30帧视频弄成240帧的慢动作视频，有人用PyTorch实现了这个算法。

相关报导：

《脑补慢动作的AI源代码来了：有了它，普通视频也能平滑补帧》

论文地址：

~hzjiang/projects/superslomo/

源代码：

NLP的预训练模型库（306赞）

这是来自创业公司Hugging Face的汇总，最近这家公司刚获得1500万美元融资。

该项目汇总了基于Transformer的各类最新的NLP模型，包括BERT、GPT-2、RoBERTa、XLM、DistilBert、XLNet等32中预训练模型，覆盖了超过100种语言。

相关报导：

《GitHub万星NLP资源大升级：实现Pytorch和TF深度互操作，集成32个最新预训练模型》

而且这个库里的模型数目仍在持续降低中。

GitHub地址：

这就是2019年Reddit机器学习蓝筹股最受欢迎的项目，不知道你最喜欢哪一篇，觉得哪一篇对你帮助最大呢？

大咖聚首！量子位MEET会议精彩回放

量子位MEET 2020 智能未来会议精彩回放袭来！李开复、倪光南、景鲲、周伯文、吴明辉、曹旭东、叶杰平、唐文斌、王砚峰、黄刚、马原等AI大咖与你一起看懂人工智能。扫码观看回放吧~ ~

跟大咖交流 | 进入AI社群

量子位QbitAI · 头条号签约作者

'' 追踪AI技术和产品新动态

2019 年 Reddit 机器学习板块关注度最高的 17 篇帖子，你看过吗？

相关帖子

浏览过的版块