github¶
GitHub是软件开发项目的最受欢迎的平台。它为代码协作和CI/CD提供了开箱即用的解决方案,这些解决方案是独特且高价的。我们决定改善集成,并为使用两个平台提供更平稳的工作流程,以便Dagshub社区可以在其机器学习项目中使用最佳的GitHub提供。
集成如何工作?¶
Dagshub上的GitHub连接的存储库具有更平滑的工作流程。除了同步GIT跟踪的文件外,Dagshub还自动同步了Repo,并可以在PUSH和实现两个平台的PR和问题上进行管理。
- 即时存储库同步 - GITHUB连接的存储库将订阅为GitHub Webhooks,并在推动代码时自动同步。
- 同步拉请求 - 在dagshub中显示了在github上创建的拉请求,反之亦然。使用dagshub查看代码,数据和模型,完成后,单击“合并”按钮以在两个平台上合并。
- 同步问题 - Dagshub开放的问题也将在GitHub上打开,并将其链接到Dagshub讨论。
- 查看GitHub星星 - 存储库的星数与您一起移动到Dagshub。现在,人们可以在Dagshub和GitHub上饰演您的项目,并且将显示在您的Dagshub存储库中。
如何将GitHub项目连接到Dagshub?¶
如果您有一个GITHUB项目可以连接,则可以在不到一分钟的时间内开始!
- 按右上角的绿色“+创建”按钮,然后单击“连接仓库”
- 单击GitHub连接按钮并在GitHub中授权
- 单击“添加/撤销访问”按钮,然后选择访问所有存储库或特定的存储库。
- 单击要在dagshub上连接的存储库,然后单击“连接存储库”。
将GitHub项目连接到Dagshub的附加值是多少?¶
通过连接从GitHub到Dagshub的ML项目,您将获得很多好处,这里有一些具体示例:
远程对象存储和实验跟踪服务器¶
当您的GIT跟踪文件留在GitHub上时,您的项目现在具有免费且完整的配置远程对象存储和实验跟踪服务器。要使用它们,您需要做的就是将几行命令复制到您的终端(由Dagshub生成),然后您就可以使用。

您可以使用DVC并使用您的实验记录到远程跟踪服务器MLFLOW跟踪。
DIFF笔记本和评论细胞¶
现在,您可以从GitHub查看现有笔记本电脑拉请求,这意味着您可以看到Rich diffs:
查看和差异数据¶
Dagshub目录可让您查看在GIT服务器和Dagshub存储上托管的各种数据类型。您可以轻松查看照片,视频,音频,CSV文件等!不仅如此,作为拉的请求的一部分,您还可以分开所有这些格式,并在完成后将其合并。

在您的ML项目中使用GitHub动作¶
将GITHUB存储库连接到Dagshub时,您可以将GITHUB操作用于CI/CD作为ML项目的组成部分。您可以将Dagshub存储与操作集成,并在打开Dagshub的拉动请求时触发操作等等。
集成指南概述
Google Colab