【发布时间】:2020-12-22 19:08:36
【问题描述】:
我想使用 Keras 的序列模型来预测序列。我的数据框包含字符串数据,因此我决定使用 sklearn 库中的LabelEncoder 对字符串数据进行编码。
我试过这段代码sn-p:
import pandas as pd
df = pd.read_csv("sample-03.csv")
from sklearn.preprocessing import LabelEncoder
df.apply(LabelEncoder().fit_transform)
给出这个结果:
此标签编码适用于具有不同值的每一列,即我需要将 http://example.com/296 表示为整个数据集的“2”。 如果能得到解决方案的建议,我将不胜感激。
我还尝试将数据集转换为元组并为此数据集使用字典,但对于不同列中的相同值,键再次不是唯一的。
【问题讨论】:
标签: scikit-learn label-encoding