【问题标题】:SKLEARN Bestfeatures.fit (X,Y), what does it mean? How do I define X and Y?SKLEARN Bestfeatures.fit (X,Y),是什么意思?如何定义 X 和 Y?
【发布时间】:2021-10-07 05:47:39
【问题描述】:

我的代码不起作用,我认为这是因为 X 和 Y 没有定义。我从一本书中得到了代码,它实际上并没有告诉我它们是如何定义的。

import pandas as pd
from matplotlib import pyplot
import seaborn as sns
from sklearn.feature_selection import SelectKBest
from sklearn.feature_selection import chi2
from sklearn.datasets import load_digits
from pandas import read_csv
from pandas.plotting import scatter_matrix


filename = '/Users/rahulparmeshwar/Documents/Algo Bots/Data/Live Data/Tester.csv'
data = read_csv(filename)

correlation = data.corr()

bestfeatures = SelectKBest(k=5)
fit = bestfeatures.fit(X,Y)

dfscores = pd.DataFrame(fit.scores_)
dfcolumns = pd.DataFrame(X.columns)
featurescores = pd.concat([dfcolumns,dfscores],axis=1)

pd.set_option('display.width',100)
data.head(1)
print(data)

scatter_matrix(data)
pyplot.show()

print(featurescores.nlargest('2,score'))

我查看了 SkLearn 的文档,但它不是很有帮助。任何帮助将不胜感激

【问题讨论】:

    标签: python python-3.x scikit-learn


    【解决方案1】:

    Xy 应该是您从数据文件加载的功能集和目标变量。这是定义它们的一种典型方式:

    data = read_csv(filename)
    y = data['target variable name']
    X = data.drop('target variable name', axis=1)
    

    【讨论】:

    • 您好,它适用于 y,但对于 X,它说它在轴上找不到。我将其更改为“Vol”,因为那是我的列名。我做错了什么?
    • @Rahul2304 查看我的更新。您必须指定axis=1 才能删除一列,否则默认为删除行。
    • 哦,我刚刚看到它,我更新了它,但是现在我在 fit=bestfeatures.fit( X,y)
    【解决方案2】:

    在此处查看此示例。

    https://github.com/ASH-WICUS/Notebooks/blob/master/Accuracies%20of%20Different%20Regressors%20-%20Housing%20Prices.ipynb

    您可以从这里下载示例代码。

    https://raw.githubusercontent.com/RuiChang123/Regression_for_house_price_estimation/master/final_data.csv

    您应该能够相对轻松地完成这项工作。然后,修改代码以满足您的特定需求。请记住,“X”由您的自变量组成,您想衡量哪些对因变量(即“y”)有影响。

    这也应该有帮助!

    https://mljar.com/blog/feature-importance-in-random-forest/

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2014-10-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2014-11-06
      • 2016-07-18
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多