热门

最新

红包

立Flag

投票

同城

我的

发布
devvaleriymphdmbacqf
predict_addict
2 年前
truedevvaleriymphdmbacqf

LightGBM用于编码类别变量的方法已经很古老了,与现代CatBoost方法相比需要更多的内存。

LightGBM的作者们本身似乎都在警告⚠️用户不要使用LightGBM来支持高基数的类别特征。

CSDN App 扫码分享
分享
评论
2
  • 复制链接
  • 举报
下一条:
当涉及到表格数据时,CatBoost占据主导地位。CatBoost之所以更胜一筹的众多原因之一,就是因为它采用了先进的创新编码技术来处理分类特征,以实现最大性能,包括防止数据泄露。但竞争对手呢?多年来,XGBoost(又名“CopyCat”)甚至无法处理分类变量,直到今天,即使它复制了CatBoost和LightGBM的功能,其处理分类变量的方法在2024年仍被标记为“实验性”的。至于LightGBM,情况变得更加有趣,其处理分类方法直接来自于1950年代——黑白电视机时代。📺。真是“创新”多多啊!
立即登录