【发布时间】:2012-06-11 19:27:07
【问题描述】:
我有一组用于机器学习的加权特征。我想减少功能集,只使用重量非常大或非常小的功能。
所以给出了下面的排序权重图像,我只想使用权重高于较高或低于较低黄线的特征。
我正在寻找的是某种斜率变化检测,因此我可以丢弃所有特征,直到第一个/最后一个斜率系数增加/减少。
虽然我(自认为)知道如何自己编写代码(使用一阶和二阶数值导数),但我对任何已建立的方法都感兴趣。也许有一些统计数据或索引可以计算类似的东西,或者我可以从 SciPy 使用的任何东西?
编辑:
目前,我将1.8*positive.std() 用作正阈值,将1.8*negative.std() 用作负阈值(快速且简单),但我还不够数学家来确定它的鲁棒性。不过,我认为不是。 ⍨
【问题讨论】: