LightGBM用于编码类别变量的方法已经很古老了，与现代C-CSDN blink-领先的开发者技术社区

热门

最新

红包

立Flag

投票

同城

我的

发布

2 年前

truedevvaleriymphdmbacqf

LightGBM用于编码类别变量的方法已经很古老了，与现代CatBoost方法相比需要更多的内存。

LightGBM的作者们本身似乎都在警告⚠️用户不要使用LightGBM来支持高基数的类别特征。

CSDN App 扫码分享

分享

评论

2

复制链接
举报

下一条：

当涉及到表格数据时，CatBoost占据主导地位。CatBoost之所以更胜一筹的众多原因之一，就是因为它采用了先进的创新编码技术来处理分类特征，以实现最大性能，包括防止数据泄露。但竞争对手呢？多年来，XGBoost（又名“CopyCat”）甚至无法处理分类变量，直到今天，即使它复制了CatBoost和LightGBM的功能，其处理分类变量的方法在2024年仍被标记为“实验性”的。至于LightGBM，情况变得更加有趣，其处理分类方法直接来自于1950年代——黑白电视机时代。📺。真是“创新”多多啊！