机器学习从数据中学习知识1、原始数据中提取特征2、学习映射函-CSDN blink-领先的开发者技术社区

热门

最新

红包

立Flag

投票

同城

我的

发布

2 年前

trueweixin_43717681

机器学习
从数据中学习知识
1、原始数据中提取特征
2、学习映射函数f
3、通过映射函数f将原始数据映射到语义空间
即寻找数据和任务目标之间的关系

CSDN App 扫码分享

分享

评论

点赞

打赏

复制链接
举报

下一条：

去除重复数据——drop_duplicates去除指定单列或多列中的完全重复的项通过drop_duplicates()函数实现，需要利用Pandas包。其中：1、subset=[] 表示整个dataframe基于[]内选定列进行数据重复内容识别，可以添加多列数据进行识别。（1）添加一列列名时表示对选中的单列数据进行重复数据识别，（2）添加多列时则表示识别多列数据同时重复的情况；2、keep='' 表示对选中的重复数据操作策略，可选择的参数为'first'、'last'和'False'三种。（1）'first'表示在识别的重复项中保留按照索引顺序的第一个内容，其余删除，（2）'last'表示在识别的重复项中保留按照索引顺序的最后一个内容，其余删除，（3）'False'表示删除所有重复项；3、inplace= 表示对处理好的dataframe存储策略，可选择参数为False和True （1）False表示不对原始数据进行去重工作，例如示例代码中data1内容不改变，将处理结果赋予data参数中，（2）True表示去重工作直接在原始数据中进行操作，例如示例代码中data1中去重操作会直接在data1中进行，data不会被赋值。data = data1.drop_duplicates(subset=['列名1','列名2'], keep='first', inplace= False)————————————————版权声明：本文为CSDN博主「羊羊麾下的发电站」的原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接及本声明。原文链接：https://blog.csdn.net/gisaavg/article/details/124516669