当前位置:网站首页 > 数据工程 > 正文

特征工程的概念(特征工程是啥)



1.1 特征工程是什么

特征工程(feature engineering)

将数据转换为能更好地表示潜在问题的特征,从而提高机器学习性能。

Color,Time即是无用的属性

坏属性(冗余属性)的影响

1.模型过拟合

2.时间成本高

1.2 特征工程效果评估

特征工程的效果评估

1.在应用特征工程之前,得到机器学习模型的基准性能;

2.在机器学习流水线中应用一种或多种特征工程;

3.将应用特征工程后的模型性能与基准性能进行对比。

性能的定义随算法的不同而改变,目前有数十种公认的指标

常见的有

评估回归问题的:

k折交叉验证

均方误差

评估无监督学习的:

轮廓系数

1.3定性定量

评分(1~5星) ,是定量还是定性?

➢定量:有4.71星这样的平均分则是定量的。

➢定量:有4.71星这样的平均分则是定量的。定性:讨厌、还行、喜欢、喜爱还是特别喜爱。

定性定量的界限是比较模糊的,所以我们引入数据等级进行细化。

1.4数据的等级

数据的4个等级

➢定类等级(nominal level)

➢定序等级(ordinal level)

➢定距等级(interval level)

➢定比等级(ratio level)

定类等级(nominal level)

➢定类等级是数据的第一个等级,只按名称分类。

➢血型(A、 B、 O和AB型)、性别(男、女)动物物种和人名。

➢可以执行的数学操作:统计众数(频次) 、不能执行任何定量数学操作。

➢定量数据,最高级别的控制和数学运算,有了一个绝对零点的概念,可以做乘除运算

➢如模型准确率、国民生产总值。

算法模型能够处理的都是定比或定距等级的数据(也就是定量的数据)

到此这篇特征工程的概念(特征工程是啥)的文章就介绍到这了,更多相关内容请继续浏览下面的相关推荐文章,希望大家都能在编程的领域有一番成就!

版权声明


相关文章:

  • 大数据课程工程师培训(大数据工程师 培训)2025-09-05 14:27:09
  • 特征工程的目的是什么(特征工程的概念)2025-09-05 14:27:09
  • 特征工程包含(特征工程包含哪三个方面?)2025-09-05 14:27:09
  • .exe文件反编译(exe文件反编译为vb工程)2025-09-05 14:27:09
  • 数据特征工程(数据特征工程常用方法)2025-09-05 14:27:09
  • vs怎么创建c程序(vs怎么建立c的工程)2025-09-05 14:27:09
  • 特征工程的两个步骤(特征工程的三个方法)2025-09-05 14:27:09
  • 数据特征工程常用方法(数据分析特征工程)2025-09-05 14:27:09
  • 特征工程的两个步骤(特征工程的两个步骤是什么)2025-09-05 14:27:09
  • 数据特征工程如何写简历(数据特征工程如何写简历内容)2025-09-05 14:27:09
  • 全屏图片