介绍:DagsHub连接-完整的GitHub集成在这里
我们为什么要建立这个集成?
“用你喜欢的工具构建ML项目”描述了我们在DagsHub所做的主要工作。知道ML项目有这么多组件,没有一个神奇的工具可以提供所有的东西,DagsHub把最好的工具放在同一个屋檐下。
在无数用户请求使用与DagsHub的GitHub动作后,连接拉请求和问题,以便我们可以检查数据和笔记本更改,以及更多,我们决定是时候将GitHub集成到下一个级别!今天,我们很高兴地宣布DagsHub Connect可以做到这一点!
新的和改进的集成将DagsHub和GitHub之间的关系不仅仅是一个镜像,通过提供使用两个平台的完整工作流,所以用户可以利用两个平台;GitHub用于代码评审和CI/CD工具,DagsHub用于数据科学评审和数据版本管理+实验跟踪。

有什么新鲜事吗?
到目前为止,GitHub连接只允许将git文件从GitHub镜像到DagsHub,并定期同步。这允许你使用DagsHub的力量,如DVC和MLflow遥控器,但正如我们所说,这是不够的。
从现在开始,DagsHub上与github相连的存储库将有一个完整的工作流程。除了上面提到的,新的更新增加了:
- 即时存储库同步-连接到GitHub的存储库订阅到GitHub的webhook,并自动保持同步。
- 同步拉请求和问题-在GitHub上创建的Pull请求和问题在DagsHub中显示,反之亦然。使用GitHub Actions进行测试,培训和部署,使用DagsHub检查代码,数据,模型和注释完成后,单击合并按钮在两个平台上合并。
- 视图GitHub的星星-仓库的星星计数移动到DagsHub!人们现在可以在DagsHub和GitHub上标记你的项目,它将显示在你的DagsHub存储库中。
- 特定的存储库访问-你现在可以控制你给我们的回购。不再需要提供完整的帐户范围的访问,只需选择您想要连接的存储库,并仅授予DagsHub对它们的访问权限。
如何连接一个GitHub库到DagsHub?
如果你有一个准备连接的GitHub项目,你可以在不到一分钟的时间内开始!
- 步骤1:按右上方的绿色“+创建”按钮,然后点击“连接回购”
- 步骤2:点击GitHub连接按钮,在GitHub中进行授权
- 步骤3:选择授予对所有存储库或想要连接的特定存储库的访问权。
- 步骤4:在DagsHub上单击需要连接的存储库,单击连接存储库.
繁荣!现在你有一个连接GitHub回购-就这么简单。
从现在开始,新问题和pr将得到一个漂亮的评论,以帮助您轻松移动到DagsHub和享受它的所有功能。

注意:你可以在“GitHub连接设置”下的DagsHub存储库设置中更改注释设置。

通过将GitHub存储库连接到DagsHub而获得的超能力
我连接了我的存储库。现在怎么办呢?
很高兴你问了,我的斜体字朋友。
通过将您的存储库连接到DagsHub,您可以获益DagsHub存储,实验跟踪,DagsHub注释、数据管道、数据可视化和数据科学评论功能。
那些是什么?你可能会问,让我们来探索一下你获得的一些能力。最佳电子竞技即时竞猜平台。
完全配置DVC远程和MLflow服务器
如果您已经熟悉DagsHub,请跳过以下部分阅读有关新的好处
当你的git跟踪代码文件留在GitHub,你的数据,模型和实验生活在DagsHub,免费完全配置"远程和一个MLflow服务器.要使用每一个命令,您所需要做的就是将几行命令复制到您的终端(由DagsHub生成),然后就可以开始了。

您可以使用来管理数据的存储和版本"并将您的实验记录到远程跟踪服务器使用MLflow跟踪.
但我为什么需要这些?我用我的Git服务器做得很好。
你是真的吗?因为看起来你的数据很乱谷歌驱动器上的zip文件.如果您是一个正在寻找有组织的、专业的工作流程的个人或团队,让我们探索一些DagsHub派上用场的实际用例。最佳电子竞技即时竞猜平台。
1.Diff笔记和对DagsHub细胞的评论
在GitHub中浏览笔记本作为PR的一部分并不是最好的体验。GitHub像对待任何其他代码文件一样对待笔记本,并试图显示笔记本的底层JSON的差异。这对于实际查看发生了什么变化是没有用的,特别是如果您想比较图形、图像等丰富的输出。
有了新的集成,你可以使用DagsHub从GitHub查看你现有的笔记本拉请求,这意味着你可以看到丰富的差异:


也评论都,包括特定的笔记本细胞!

这个笔记本是回购的deadtrees通过基督教沃纳
2.在ML项目中使用GitHub Actions
很长一段时间以来,我们得到的请求最多的功能可能是如何使用DagsHub与GH动作!我们听取了您的请求,您现在可以通过DagsHub使用GH操作打开PRs -像数据测试、自动化训练和部署模型现在都可以使用GH操作。请继续关注有关如何做到这一点的其他示例。你可以集成DagsHub存储当你打开和合并拉请求,推代码和数据时,你的动作和触发动作。
天空是极限!我们迫不及待地想看看你们的作品
3.查看和区分各种数据类型
虽然GitHub托管并让你查看和检查你的代码,但你的数据通常位于其他地方。很多时候,这种存储无法很好地可视化所有不同的数据类型,更不用说可以查看数据的工具了。
DagsHub允许您查看托管在Git服务器、DagsHub Storage或上的各种数据类型您自己的对象存储.您可以轻松查看照片,视频,音频,CSV文件,和更多!
不仅如此,数据已进行版本控制所以你可以显示所有这些格式的差异,打开一个数据PR,检查更改,并在完成后合并它们。


4.明星✨
为了保持你在GitHub上长期赢得的声誉,仓库明星移动到DagsHub与你!不仅如此,你现在可以从GitHub和DagsHub获得星星!

接下来是什么?
你对GitHub集成有什么看法?我们很想听听你对GitHub集成改进的看法。接下来你想看什么?
请通过我们的不和频道!
下次见!