特征工程包括【特征构造】【数值处理】【特征选择】

1.【特征构造】数据和特征决定了机器学习的上限:切片静态特征,切片聚合特征,时序聚合特征

2.【数值处理】:标准/归一化;缺失值填充;分箱方法;特征编码;

分箱方法:

风控场景下的常用特征分箱介绍:BestKs分箱、卡方分箱、聚类分箱等 – 百度文库 (baidu.com)

风控建模中的分箱方法——原理与代码实现 – 知乎 (zhihu.com)

特征编码:

Label编码,one-hot编码,Target编码,模型自动编码,Embedding嵌入,WOE编码

3.【特征选择】:WOE(weight of evidence 证据权重),IV(Information value 信息价值,是woe的加权和),VIF(variance inflation factor 方差膨胀系数),PSI(population stability index 群体稳定性指标)


版权声明:本文为yamgyutou原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
原文链接:https://blog.csdn.net/yamgyutou/article/details/128826925