【发布时间】:2021-08-03 12:09:03
【问题描述】:
我正在使用一个名为 mRMRe 的 R 包来帮助我进行一些快速的特征选择,但我发现这个包的文档非常混乱。
我的数据集有大约 400 列/特征,最后一列是二元结果。
基本上,我这样计算 MRMR 分数:
tmp.step4 <- mRMR.classic( "mRMRe.Filter",
data = myDataset ,
feature_count = featureCount( myDataset ) - 1,
target_indices = 400 )
由于我不知道我真正需要多少特征,我想计算每个特征的 MRMR 分数,我可以根据分数进行逐步变量消除。
我这样检索 MRMR 计算结果:
scores( tmp.step4 )
solutions( tmp.step4 )
我可以看到求解函数的输出是一个数值列表,我假设它是我的列/特征编号的索引。 score函数的输出函数是一个排序后的数值向量,但我不认为这与我的特征直接对应(例如一对一投影)。
我的问题很简单:
如何让分数与功能名称配对?
如:
特征1:0.111
特征 2:0.222
特征3:0.333
...
非常感谢
【问题讨论】:
标签: r machine-learning feature-selection feature-engineering