想请教关于数据集数量选择的问题我是在做一个二分类问题,标签为1的数据集大概三千条,但是标签为0的数据集有几十万条,所以我想问一下应该如何选择数据集算法使用GBDT还有XGBoost三千条标签为1的数据量算少吗?如果算少的话,应该使标签1数据达到多少条,并且再取多少条标签为0的数据才合适呢?如果不算少的话,那标签为0的数据应该取多少呢?还是说全部采用呢?