【发布时间】:2020-01-21 07:42:12
【问题描述】:
目前我正在开发一个视频推荐系统,它将以 0(负面)和 1(正面)的形式预测视频。我成功地从 YouTube 上抓取了数据集,还以 0(负面)和 1(正面)的形式找到了 YouTube cmets 的情绪。我使用一个热编码器对我的 csv 的文本数据进行编码,并以 numpy 数组的形式获得输出。现在我的问题是如何在逻辑回归中将 numpy 数组作为输入(X)?下面是我的代码、输出和 csv(1874 X 2)。
目标变量是Comments_Sentiments
#OneHotEncoding
import numpy as np
import pandas as pd
from sklearn import preprocessing
X = pd.read_csv("C:/Users/Shahnawaz Irfan/Desktop/USIrancrisis/demo.csv")
#X.head(5)
X = X.select_dtypes(include=[object])
#X.head(5)
#X.shape
#X.columns
le = preprocessing.LabelEncoder()
X_2 = X.apply(le.fit_transform)
X_2.head()
enc = preprocessing.OneHotEncoder()
enc.fit(X_2)
onehotlabels = enc.transform(X_2).toarray()
onehotlabels.shape
onehotlabels
输出是:
array([[1.],
[1.],
[1.],
...,
[1.],
[1.],
[1.]])
任何人都可以通过将此 numpy 数组作为逻辑回归的输入来解决此查询吗?
【问题讨论】:
标签: numpy logistic-regression one-hot-encoding