热门
最新
红包
立Flag
投票
同城
我的
发布
predict_addict
2 年前
truedevvaleriymphdmbacqf
LightGBM用于编码类别变量的方法已经很古老了,与现代CatBoost方法相比需要更多的内存。
LightGBM的作者们本身似乎都在警告⚠️用户不要使用LightGBM来支持高基数的类别特征。
下一条:
当涉及到表格数据时,CatBoost占据主导地位。CatBoost之所以更胜一筹的众多原因之一,就是因为它采用了先进的创新编码技术来处理分类特征,以实现最大性能,包括防止数据泄露。但竞争对手呢?多年来,XGBoost(又名“CopyCat”)甚至无法处理分类变量,直到今天,即使它复制了CatBoost和LightGBM的功能,其处理分类变量的方法在2024年仍被标记为“实验性”的。至于LightGBM,情况变得更加有趣,其处理分类方法直接来自于1950年代——黑白电视机时代。📺。真是“创新”多多啊!
立即登录