【问题标题】:how to take numpy array as an input in logistic regression?如何将 numpy 数组作为逻辑回归的输入?
【发布时间】:2020-01-21 07:42:12
【问题描述】:

目前我正在开发一个视频推荐系统,它将以 0(负面)和 1(正面)的形式预测视频。我成功地从 YouTube 上抓取了数据集,还以 0(负面)和 1(正面)的形式找到了 YouTube cmets 的情绪。我使用一个热编码器对我的 csv 的文本数据进行编码,并以 numpy 数组的形式获得输出。现在我的问题是如何在逻辑回归中将 numpy 数组作为输入(X)?下面是我的代码、输出和 csv(1874 X 2)。

目标变量是Comments_Sentiments

#OneHotEncoding
import numpy as np
import pandas as pd
from sklearn import preprocessing

X = pd.read_csv("C:/Users/Shahnawaz Irfan/Desktop/USIrancrisis/demo.csv")
#X.head(5)

X = X.select_dtypes(include=[object])
#X.head(5)

#X.shape

#X.columns

le = preprocessing.LabelEncoder()

X_2 = X.apply(le.fit_transform)
X_2.head()

enc = preprocessing.OneHotEncoder()
enc.fit(X_2)

onehotlabels = enc.transform(X_2).toarray()
onehotlabels.shape

onehotlabels

输出是:

array([[1.],
   [1.],
   [1.],
   ...,
   [1.],
   [1.],
   [1.]])

任何人都可以通过将此 numpy 数组作为逻辑回归的输入来解决此查询吗?

【问题讨论】:

    标签: numpy logistic-regression one-hot-encoding


    【解决方案1】:

    你可以使用反函数enc.inverse_transform([[0, 1, 1, 0, 0], [0, 0, 0, 1, 0]])enc.fit([[0, 0, 3], [1, 1, 0], [0, 2, 1], [1, 0, 2]])

    【讨论】:

    • 好的,我使用inverse_transform 方法,但我可以使用onehotlabels 变量作为参数吗?因为输出存储在onehotlabels变量中
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2020-07-24
    • 1970-01-01
    • 2022-12-17
    • 2019-08-17
    • 2016-04-10
    相关资源
    最近更新 更多