总结:用于实践数据科学的前5篇机器学习文章- 2021年第三季度
每个季度,我们都会请DagsHub团队收集他们的顶级库、机器学习文章和数据科学技巧。以下是我们最喜欢的五个主题,涉及深度学习、可解释性、数据版本控制和数据科学中的多租户问题。
我们相信你会发现这很有用,如果你有任何你自己的资源,请随时分享info@www.kkolawyers.com!
1.我应该为每个客户训练一个模型,还是为所有客户使用一个模型?
本文有一些有趣的链接,介绍了如何决定是为每个客户训练一个模型,还是为所有客户训练一个模型。它强调了在机器学习中处理多租户问题的四种不同策略的优点和缺点——它写得很好,并且对这个过程有个人的见解:
https://towardsdatascience.com/should-i-train-a-model-for-each-customer-or-use-one-model-for-all-of-my-customers-f9e8734d991
2.一篇全面的机器学习文章:机器学习和深度学习纲要
作为经验丰富的数据科学家的知识的升华,本纲要旨在将您可能需要的每个主题都包含在其目录中,并提供简明的解释和进一步阅读的链接。有超过500个主题和一个GitHub项目,这个纲要将节省你无数的时间谷歌和筛选文章。非常实用和有用的,即使是经验丰富的数据科学家想要扩大他们的知识。
https://book.mlcompendium.com/
3.简单地说,DVC版本控制
(没有代码!)
DVC是用于大文件版本控制的最广泛采用的开源工具。视频详细介绍了DVC,并介绍了如何使用DVC和Git来对数据和代码进行版本化。任何对数据版本控制方法感兴趣的人都必须注意。完全披露:这个视频是由DagsHub团队制作的,也给出了与DVC和DagsHub合作的例子。
https://www.youtube.com/watch?v=QYNgWWearZ4
4.很棒的可解释的图形推理
还有什么比图形机器学习和gnn更好的呢?我们认为,这篇可解释图机器学习文章!这是一组来自阿斯利康的优秀文章和软件,包括许多关于图表解释性和推理的出色研究。它涵盖了可解释的预测,可解释的推理,代码以及一些理论和调查论文
https://github.com/AstraZeneca/awesome-explainable-graph-reasoning
5.机器学习中的可解释性和可解释性
如果你在找一个机器学习文章explainability而且可解释性在美国,可能很难找到好的内容,所以我们想分享一个COMPSCI 282BR课程的推荐修玛Llakkaraju艾萨克·拉格。随着模型在金融、医疗保健甚至刑事司法领域的应用越来越多,模型的透明以及决策者理解和信任预测变得至关重要。
https://interpretable-ml-class.github.io/
本季度就这样结束了。如果您有任何有趣的数据科学或机器学习文章,希望得到推荐并与我们的社区分享,请发送给我们,并将您的链接和简要描述通过电子邮件发送到info@www.kkolawyers.com!