当涉及到表格数据时,CatBoost占据主导地位。CatBoost之所以更胜一筹的众多原因之一,就是因为它采用了先进的创新编码技术来处理分类特征,以实现最大性能,包括防止数据泄露。
但竞争对手呢?多年来,XGBoost(又名“CopyCat”)甚至无法处理分类变量,直到今天,即使它复制了CatBoost和LightGBM的功能,其处理分类变量的方法在2024年仍被标记为“实验性”的。
至于LightGBM,情况变得更加有趣,其处理分类方法直接来自于1950年代——黑白电视机时代。📺。
真是“创新”多多啊!