如何将 numpy 数组作为逻辑回归的输入？答案

【问题标题】：how to take numpy array as an input in logistic regression?如何将 numpy 数组作为逻辑回归的输入？
【发布时间】：2020-01-21 07:42:12
【问题描述】：

目前我正在开发一个视频推荐系统，它将以 0（负面）和 1（正面）的形式预测视频。我成功地从 YouTube 上抓取了数据集，还以 0（负面）和 1（正面）的形式找到了 YouTube cmets 的情绪。我使用一个热编码器对我的 csv 的文本数据进行编码，并以 numpy 数组的形式获得输出。现在我的问题是如何在逻辑回归中将 numpy 数组作为输入（X）？下面是我的代码、输出和 csv(1874 X 2)。

目标变量是Comments_Sentiments

#OneHotEncoding
import numpy as np
import pandas as pd
from sklearn import preprocessing

X = pd.read_csv("C:/Users/Shahnawaz Irfan/Desktop/USIrancrisis/demo.csv")
#X.head(5)

X = X.select_dtypes(include=[object])
#X.head(5)

#X.shape

#X.columns

le = preprocessing.LabelEncoder()

X_2 = X.apply(le.fit_transform)
X_2.head()

enc = preprocessing.OneHotEncoder()
enc.fit(X_2)

onehotlabels = enc.transform(X_2).toarray()
onehotlabels.shape

onehotlabels

输出是：

array([[1.],
   [1.],
   [1.],
   ...,
   [1.],
   [1.],
   [1.]])

任何人都可以通过将此 numpy 数组作为逻辑回归的输入来解决此查询吗？

【问题讨论】：

标签： numpy logistic-regression one-hot-encoding

【解决方案1】：

你可以使用反函数enc.inverse_transform([[0, 1, 1, 0, 0], [0, 0, 0, 1, 0]])enc.fit([[0, 0, 3], [1, 1, 0], [0, 2, 1], [1, 0, 2]])

【讨论】：

好的，我使用inverse_transform 方法，但我可以使用onehotlabels 变量作为参数吗？因为输出存储在onehotlabels变量中