代码ML再现性挑战的结束语- 2021年春季
回到博客主页

代码ML再现性挑战的结束语- 2021年春季

协作 2021年12月14日

ML再现性挑战的2021年春季版正式结束了,我们有一些由DagsHub社区贡献的鼓舞人心的项目来分享!

数据科学再现性是DagsHub成立的核心原因之一,我们不断开发新的工具和集成来支持完全可再生的工作流.这就是为什么我们对论文与代码-可再现性挑战并决定第二次支持其参与者(剧透警告我们还将支持2021年秋季挑战赛!)

“独立验证数据是跨学科科学研究的基本原则。科学方法的自我纠正机制依赖于研究人员再现已发表研究结果的能力,以便加强证据并在现有工作的基础上建立。”自然

在2021年春季版中,我们支持3个团队提交了完全开源和可复制的ML论文,现在您可以轻松使用!雷竞技技官网下载在我们深入项目之前,我们想给我们的荣誉论文和代码感谢组织这次活动的社区成员,感谢他们花费时间和精力复制文件,并使其易于访问。

从图片男高音

所以,没有更多的截止日期,我想欢迎2021年春季版的转载论文!


语境分解解释惩罚

这篇论文
存储库

参与者:

为了解释深度学习模型是有效的,它必须提供对模型的见解,并提出相应的行动,以实现某些目标。通常情况下,冗长的可解释的深度学习方法在第一步就停止了,为实践者提供了对模型的洞察,但没有办法采取行动。这篇论文的作者

本文提出了上下文分解解释惩罚(CDEP),该方法允许在训练过程中使用解释来惩罚模型,从而避免学习到虚假关联.CDEP借助解释将特征空间分解为相关特征和不相关特征,并对模型进行惩罚,查看相关特征进行分类。例如,在ISIC皮肤癌分类任务,该数据集包含带有偏见的图像,其中阳性患者戴着创可贴。通过使用CDEP,可以训练模型忽略创可贴特征,即偏差,并学习正确的特征。在存储库中,CDEP已被应用于跨多种模式的不同架构。

来自官方文件:图S4。来自ISIC的良性样品热图

在这个项目中,Shailesh、Azhar和Midhush重新执行了最初的设计PyTorch项目Tensorflow.这要求他们写作PyTorch的unpool函数,以便在Tensorflow中使用它。这后来成为了补丁被推送到Tensorflow Addons仓库,让他们以一个的价格为两个开源项目做出贡献!


少镜头学习的自我监督

这篇论文
存储库

参与者:

在本文中,研究人员探讨了self-supervised学习上下文中的SSLfew-shot学习(目前)。尽管最近的研究表明SSL在大型未标记数据集上的好处,但它在小型数据集上的效用还相对未被探索。最佳电子竞技即时竞猜平台。他们发现SSL使少镜头元学习者的相对错误率降低了4%-27%,即使数据集很小,只使用数据集中的图像。

来自官方文件:结合监督和自我监督损失的少镜头学习。
“我们选择这篇论文是因为少镜头学习是一种新兴的、越来越受欢迎的机器学习范式,而自我监督学习似乎是在FSL中获得更好性能的一种简单方法,没有花哨的东西。”Arjun和Haswanth

Arjun和Haswanth在基于作者代码库的五个基准数据集上复制并验证了该论文的主要结果。此外,他们还从头开始实现了域选择算法,并验证了其优点。

这篇论文使用了224x224的图像大小,这引起了阿琼和哈斯万斯的兴趣,所以他们决定研究它是如何影响模型性能的。他们将图像大小修改为84x84,这是FSL论文中常用的设置,同时还简化了架构。他们发现这个设置是一个失败,恶化了模型的性能。


甘可判断的控制

这篇论文
存储库

贡献者

本文介绍了一种简单的分析方法甘斯模型并创建可解释的控制图像合成,如改变视角,老化,照明和时间的一天。

来自官方论文:图1:使用我们的方法发现的控制执行的图像编辑序列,应用于三种不同的GANs。

毗湿奴和米德hush使用StyleGAN而且StyleGAN2重现论文结果的模型。两种模型都是通过计算映射网络输出的主成分分析(PCA)来实现的。这提供了映射网络空间的基础,从中我们可以通过改变PCA坐标来编辑一个新的向量。然后将增广向量输入到综合网络中,得到具有修改属性的图像。

毗湿奴和米德hush改变了原稿PyTorch实现并验证了论文中提出的主张。他们使用论文中使用的基准数据集来训练模型,例如FFHQLSUN汽车,CelebAHQ.为了验证他们的结果,他们用原始论文中没有使用的数据集测试了模型的性能,例如甲虫而且动漫肖像

“最初,我们试图使用原始的PyTorch代码和我们在Tensorflow中修改的代码重新创建具有相同RGB值的图像。然而,由于PyTorch和Tensorflow中随机数生成器的不同,即使是相同的种子,其随机值也不相同。这导致了一些生成图像的背景伪影的细微差异。一旦我们确定这是造成微小差异的原因,我们就能够在Tensorflow实现中插入PyTorch的随机数生成器,并成功地重现这些图像。最终,我们能够验证与StyleGAN和StyleGAN2模型相关的所有声明“毗湿奴和米德hush

总结

我们要感谢所有参与这项挑战的了不起的数据科学家。DagsHub团队喜欢与你们每一个人合作,并在此过程中学到了很多东西。你对社区产生了很大的影响,让我们更接近雷竞技技官网下载开源数据科学.如前所述,我们支持代码可再现性挑战论文2021年秋季版。如果你想参与并推动机器学习领域的发展,请访问新的指南页面和加入我们不和谐社会开始!团队在这里提供帮助!

标签

近红外光谱Barazida

在与院长Pleban

数据科学家@ DAGsHub

太棒了!您已经成功订阅。
太棒了!接下来,完成检查以获得完全访问权。
欢迎回来!您已经成功登录。
成功!您的帐户已完全激活,您现在可以访问所有内容。