来自AWS Data Registry的400个数据集在DagsHub上可用
回到博客主页

来自AWS Data Registry的400个数据集在DagsHub上可用

我们很高兴分享我们添加的内容从AWS Registry到DagsHub的400个数据集,您可以查看,流式传输并在您的机器学习项目中使用。这些数据集由各种政府组织、研究人员、企业和个人拥有和维护,涵盖了各种领域,包括音频、计算机视觉、自然语言处理、地质、生物和表格数据。

来自AWS Data Registry的400个数据集在DagsHub上可用
DagsHub数据集

在哪里可以找到来自AWS注册表的400多个数据集?

您可以在新的Da最佳电子竞技即时竞猜平台。gsHub Dataset页面上探索来自AWS Registry的400个数据集。它在用户友好的界面中保存了所有可用的和最新的数据集,使人们能够按类别浏览和过滤数据集,例如音频,计算机视觉,NLP,地质,生物和表格数据。

每个数据集卡都包含数据集的简要描述,数据集存储库的链接,用于流式传输的代码片段以及所有相关标记。使用DagsHub的Data Catalog,您可以无缝地探索数据集,查看它们的内容,并在机器学最佳电子竞技即时竞猜平台。习项目中使用它们。

如何将AWS Registry中的数据集与DagsHub一起使用?

直接数据访问支持连接到DagsHub存储库的s3桶中的流文件。这意味着您可以流式传输AWS Registry数据集的子集,而无需将其完全下载到本地存储。

看看这个例子:

从dagshub。stream import DagsHubFilesystem fs = DagsHubFilesystem(".", repo_url="") fs.listdir("s3://fast-ai-imageclas")

演示:如何使用来自AWS注册表的数据集

要找到满足您需求的数据集,您可以查看dataset DB登陆页面,并通过单击“点击查看更多”按钮探索特定数据域下支持的数据集。最佳电子竞技即时竞猜平台。

来自AWS的音频数据集-在DagsHub上可用
音频数据集

当您找到感兴趣的数据集时,单击数据集卡并在数据集页面上查看更多信息。

DagsHub上的数据集卡
数据集卡

按下链接按钮以访问存储库或复制DDA片段以流式传输数据。

使用DagsHub从AWS流数据集
使用DagsHub从AWS流数据集

如何在DagsHub上过滤数据集

为机器学习项目探索数据集的另一种方法是按数据目录过滤数据集。例如,如果您正在寻找由AWS注册中心提供的计算机视觉数据集,您可以在General中选择open-data-registry,在Integration中选择AWS s3。将数据域主题指定为计算机视觉,您就可以开始探索由AWS注册中心提供的计算机视觉数据集了。

DagsHub数据集
DagsHub数据集

如何使用AWS的数据集构建机器学习项目?

如果您正在寻找使用DagsHub的直接数据访问特性的令人兴奋的示例,请查看这个项目DagsHub !该项目演示了如何使用DagsHub-Dataset提供的MNIST数据集训练计算机视觉模型。

拥有超过400个数据集和来自DagsHub的直接数据访问,您再也不必担心机器学习项目缺乏高质量的数据。那你还在等什么?今天就开始探索Dataset DB吧!

标签

太棒了!您已成功订阅。
太棒了!接下来,完成签出以获得完全访问权限。
欢迎回来!您已成功登录。
成功!您的帐户已完全激活,您现在可以访问所有内容。