RPPP - Reddit Post popular Predictor
有两个目标的项目:
1.给定一个Reddit帖子,预测它会有多受欢迎(它的得分会是多少)
2.展示了一个使用DVC的远程工作文件系统

一般: 远程工作文件系统 数据域: nlp 表格 集成: " git
迪安 2 e0f2b35fb
合并Dean/RPPP的“本地化-wfs”分支到master
1年前
7942年d96f38
移除项目中的remote-wfs元素。所有dvc管理的文件都是本地的。
1年前
7942年d96f38
移除项目中的remote-wfs元素。所有dvc管理的文件都是本地的。
1年前
7942年d96f38
移除项目中的remote-wfs元素。所有dvc管理的文件都是本地的。
1年前
d9735a5dd8
添加贡献指南
2年前
0 aa625a470
更新“README.md”
2年前
7942年d96f38
移除项目中的remote-wfs元素。所有dvc管理的文件都是本地的。
1年前
7942年d96f38
移除项目中的remote-wfs元素。所有dvc管理的文件都是本地的。
1年前
7942年d96f38
移除项目中的remote-wfs元素。所有dvc管理的文件都是本地的。
1年前
b2eb747da1
完成基于文本的分类器训练。
2年前
7942年d96f38
移除项目中的remote-wfs元素。所有dvc管理的文件都是本地的。
1年前
b54b8e2185
增加了训练指标的计算,修改了与阶段相关的指标文件名
2年前
b6c2981a67
这就完成了数值和类别基础模型的训练。
2年前
b6c2981a67
这就完成了数值和类别基础模型的训练。
2年前
7942年d96f38
移除项目中的remote-wfs元素。所有dvc管理的文件都是本地的。
1年前
7942年d96f38
移除项目中的remote-wfs元素。所有dvc管理的文件都是本地的。
1年前
50 aefb4765
增加了使数据集阶段在BigQuery上运行查询并将原始数据保存到远程工作文件系统。
2年前
cac18be035
添加“remote-wfs-setup.md”
2年前
4 d47e01475
更新requirements.txt中的dvc版本
1年前
7942年d96f38
移除项目中的remote-wfs元素。所有dvc管理的文件都是本地的。
1年前
7942年d96f38
移除项目中的remote-wfs元素。所有dvc管理的文件都是本地的。
1年前
7942年d96f38
移除项目中的remote-wfs元素。所有dvc管理的文件都是本地的。
1年前
数据管道
传说
DVC托管文件
Git管理文件
度规
阶段文件
外部文件

README.md

你必须登录才能留言。登录

RPPP - Reddit Post popular Predictor

这个项目试图预测一个reddit提交将受欢迎与否根据它的特点。

我们目前只提供r/MachineLearning模型,基于提交的标题和主体。

远程工作文件系统

本项目也是对DVC远程WFS工作流程的一次探索。要设置您的远程WFS -阅读这里:远程WFS设置

贡献

欢迎投稿!

读了贡献指南更多信息。

工作思路:

  • 将文本和数字分类器合并为一个模型!
  • 添加UI来测试你的帖子是否会成功!
  • 添加MOAR数据!(其他看板,更多来自r/ML)
  • 改进模型性能(还有很多需要改进的地方)!
  • 增加文化基因:添加MOAR表情包
提示!

新闻p要查看以前的文件或,n查看下一个文件

评论

加载……