介绍:DagsHub连接-完整的GitHub集成在这里
回到博客主页

介绍:DagsHub连接-完整的GitHub集成在这里

GitHub 2022年4月25日

我们为什么要建立这个集成?

“用你喜欢的工具构建ML项目”描述了我们在DagsHub所做的主要工作。知道ML项目有这么多组件,没有一个神奇的工具可以提供所有的东西,DagsHub把最好的工具放在同一个屋檐下。

在无数用户请求使用与DagsHub的GitHub动作后,连接拉请求和问题,以便我们可以检查数据和笔记本更改,以及更多,我们决定是时候将GitHub集成到下一个级别!今天,我们很高兴地宣布DagsHub Connect可以做到这一点!

新的和改进的集成将DagsHub和GitHub之间的关系不仅仅是一个镜像,通过提供使用两个平台的完整工作流,所以用户可以利用两个平台;GitHub用于代码评审和CI/CD工具,DagsHub用于数据科学评审和数据版本管理+实验跟踪。

有什么新鲜事吗?

到目前为止,GitHub连接只允许将git文件从GitHub镜像到DagsHub,并定期同步。这允许你使用DagsHub的力量,如DVC和MLflow遥控器,但正如我们所说,这是不够的。

从现在开始,DagsHub上与github相连的存储库将有一个完整的工作流程。除了上面提到的,新的更新增加了:

  • 即时存储库同步-连接到GitHub的存储库订阅到GitHub的webhook,并自动保持同步。
  • 同步拉请求和问题-在GitHub上创建的Pull请求和问题在DagsHub中显示,反之亦然。使用GitHub Actions进行测试,培训和部署,使用DagsHub检查代码,数据,模型和注释完成后,单击合并按钮在两个平台上合并。
  • 视图GitHub的星星-仓库的星星计数移动到DagsHub!人们现在可以在DagsHub和GitHub上标记你的项目,它将显示在你的DagsHub存储库中。
  • 特定的存储库访问-你现在可以控制你给我们的回购。不再需要提供完整的帐户范围的访问,只需选择您想要连接的存储库,并仅授予DagsHub对它们的访问权限。

如何连接一个GitHub库到DagsHub?

如果你有一个准备连接的GitHub项目,你可以在不到一分钟的时间内开始!

  • 步骤1:按右上方的绿色“+创建”按钮,然后点击“连接回购”
  • 步骤2:点击GitHub连接按钮,在GitHub中进行授权
  • 步骤3:选择授予对所有存储库或想要连接的特定存储库的访问权。
  • 步骤4:在DagsHub上单击需要连接的存储库,单击连接存储库

繁荣!现在你有一个连接GitHub回购-就这么简单。

从现在开始,新问题和pr将得到一个漂亮的评论,以帮助您轻松移动到DagsHub和享受它的所有功能。

注意:你可以在“GitHub连接设置”下的DagsHub存储库设置中更改注释设置。

通过将GitHub存储库连接到DagsHub而获得的超能力

我连接了我的存储库。现在怎么办呢?
很高兴你问了,我的斜体字朋友。

通过将您的存储库连接到DagsHub,您可以获益DagsHub存储实验跟踪DagsHub注释、数据管道、数据可视化和数据科学评论功能。

那些是什么?你可能会问,让我们来探索一下你获得的一些能力。最佳电子竞技即时竞猜平台。

完全配置DVC远程和MLflow服务器

如果您已经熟悉DagsHub,请跳过以下部分阅读有关新的好处

当你的git跟踪代码文件留在GitHub,你的数据,模型和实验生活在DagsHub,免费完全配置"远程和一个MLflow服务器.要使用每一个命令,您所需要做的就是将几行命令复制到您的终端(由DagsHub生成),然后就可以开始了。

按下”?图标,显示使用遥控器需要输入的命令。

您可以使用来管理数据的存储和版本"并将您的实验记录到远程跟踪服务器使用MLflow跟踪

但我为什么需要这些?我用我的Git服务器做得很好。

你是真的吗?因为看起来你的数据很乱谷歌驱动器上的zip文件.如果您是一个正在寻找有组织的、专业的工作流程的个人或团队,让我们探索一些DagsHub派上用场的实际用例。最佳电子竞技即时竞猜平台。


1.Diff笔记和对DagsHub细胞的评论

在GitHub中浏览笔记本作为PR的一部分并不是最好的体验。GitHub像对待任何其他代码文件一样对待笔记本,并试图显示笔记本的底层JSON的差异。这对于实际查看发生了什么变化是没有用的,特别是如果您想比较图形、图像等丰富的输出。

有了新的集成,你可以使用DagsHub从GitHub查看你现有的笔记本拉请求,这意味着你可以看到丰富的差异:

这是当试图在GitHub上查看笔记本diff时发生的事情
这就是他们在DagsHub上出现的方式

评论都,包括特定的笔记本细胞!

这个笔记本是回购的deadtrees通过基督教沃纳

2.在ML项目中使用GitHub Actions

很长一段时间以来,我们得到的请求最多的功能可能是如何使用DagsHub与GH动作!我们听取了您的请求,您现在可以通过DagsHub使用GH操作打开PRs -像数据测试、自动化训练和部署模型现在都可以使用GH操作。请继续关注有关如何做到这一点的其他示例。你可以集成DagsHub存储当你打开和合并拉请求,推代码和数据时,你的动作和触发动作。

天空是极限!我们迫不及待地想看看你们的作品

3.查看和区分各种数据类型

虽然GitHub托管并让你查看和检查你的代码,但你的数据通常位于其他地方。很多时候,这种存储无法很好地可视化所有不同的数据类型,更不用说可以查看数据的工具了。

DagsHub允许您查看托管在Git服务器、DagsHub Storage或上的各种数据类型您自己的对象存储.您可以轻松查看照片,视频,音频,CSV文件,和更多!

不仅如此,数据已进行版本控制所以你可以显示所有这些格式的差异,打开一个数据PR,检查更改,并在完成后合并它们。

DagsHub让你看到和审查注释文件使用“DagsHub注释”

4.明星✨

为了保持你在GitHub上长期赢得的声誉,仓库明星移动到DagsHub与你!不仅如此,你现在可以从GitHub和DagsHub获得星星!

接下来是什么?

你对GitHub集成有什么看法?我们很想听听你对GitHub集成改进的看法。接下来你想看什么?

请通过我们的不和频道!

下次见!

标签

太棒了!您已经成功订阅。
太棒了!接下来,完成签出以获得完全访问权限。
欢迎回来!您已经成功登录。
成功!您的帐户已完全激活,您现在可以访问所有内容。