热门

最新

红包

立Flag

投票

同城

我的

发布
k659s
k659s
5 年前
truek659s

想请教关于数据集数量选择的问题
我是在做一个二分类问题,标签为1的数据集大概三千条,但是标签为0的数据集有几十万条,所以我想问一下应该如何选择数据集
算法使用GBDT还有XGBoost
三千条标签为1的数据量算少吗?

如果算少的话,应该使标签1数据达到多少条,并且再取多少条标签为0的数据才合适呢?
如果不算少的话,那标签为0的数据应该取多少呢?还是说全部采用呢?

保持热爱共赴山海
CSDN App 扫码分享
分享
评论
点赞
打赏
  • 复制链接
  • 举报
下一条:
这个怎么解决啊?宝塔安装出现问题,用的是ubuntu的那个执行代码,如图所示
立即登录