特征工程的主要步骤分6步:
1.特征理解,学习如何识别定量数据和定性数据
2.特征增强,清洗和填充缺失值,最大化数据集的价值
3.特征构建,构建新的特征,探索特征间的联系
4.特征选择,通过统计方法选择一部分特征,以减少数据噪声
5.特征转换,提取数据中的隐藏结构,用数学方法转换数据集,增强效果
6.特征学习,用简单的神经网络学习特征
数据可以分为四个等级:
二、特征增强
一下均假设得到的数据集为df,x为df的自变量集合,y为df的因变量集合
1.删除无数据的行
在删除了之后需要比较一下各列均值的变化
使用填充器填充
(2)min-max标准化,使得所有值在0-1之间
(3)行归一化,使得每行的向量长度相同
三、特征构建
1.自定义填充器
(1)自定义分类填充器
(2)自定义分量填充器
(2)定序等级的编码
(2)tf-idf向量化
四、特征选择
1.基于统计的特征选择
(1)皮尔逊相关系数
(2)假设检验
根据阈值进行模型选择
2.线性判别分析,用于对数据分类划分出决策边界
(未完)
到此这篇特征工程怎么做(如何做特征工程)的文章就介绍到这了,更多相关内容请继续浏览下面的相关 推荐文章,希望大家都能在编程的领域有一番成就!版权声明:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若内容造成侵权、违法违规、事实不符,请将相关资料发送至xkadmin@xkablog.com进行投诉反馈,一经查实,立即处理!
转载请注明出处,原文链接:https://www.xkablog.com/kjbd-gc/26919.html