特征工程怎么做（如何做特征工程）

数据工程来源：网络编辑：小编更新时间：2026-01-14 18:45:08 浏览量：53

特征工程的主要步骤分6步：
1.特征理解，学习如何识别定量数据和定性数据
2.特征增强，清洗和填充缺失值，最大化数据集的价值
3.特征构建，构建新的特征，探索特征间的联系
4.特征选择，通过统计方法选择一部分特征，以减少数据噪声
5.特征转换，提取数据中的隐藏结构，用数学方法转换数据集，增强效果
6.特征学习，用简单的神经网络学习特征

数据可以分为四个等级：

等级属性描述性统计图表定类离散无序频率/占比，众数条形图，饼图定序有序类别比较频率，众数，中位数，百分位数条形图，饼图，茎叶图定距数字差别有意义频率，众数，中位数，均值，标准差条形图，饼图，茎叶图，箱线图，直方图定比连续均值，标准差直方图，箱线图

二、特征增强
一下均假设得到的数据集为df,x为df的自变量集合，y为df的因变量集合
1.删除无数据的行

在删除了之后需要比较一下各列均值的变化

使用填充器填充

（2）min-max标准化，使得所有值在0-1之间

（3）行归一化，使得每行的向量长度相同

三、特征构建
1.自定义填充器
（1）自定义分类填充器

（2）自定义分量填充器

（2）定序等级的编码

（2）tf-idf向量化

四、特征选择
1.基于统计的特征选择
（1）皮尔逊相关系数

（2）假设检验

根据阈值进行模型选择

2.线性判别分析，用于对数据分类划分出决策边界

（未完）

到此这篇特征工程怎么做（如何做特征工程）的文章就介绍到这了,更多相关内容请继续浏览下面的相关推荐文章，希望大家都能在编程的领域有一番成就！

上一篇：大数据课程工程师培训（大数据工程师培训费）

下一篇：数据特征工程的含义（数据特征分析的定义）

版权声明：
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如若内容造成侵权、违法违规、事实不符，请将相关资料发送至xkadmin@xkablog.com进行投诉反馈，一经查实，立即处理！

转载请注明出处，原文链接：https://www.xkablog.com/kjbd-gc/26919.html

相关文章：