如何在熊猫中分割特征答案

【问题标题】：How to split a feature in pandas如何在熊猫中分割特征
【发布时间】：2019-02-16 20:44:55
【问题描述】：

这是我正在处理的训练集的前 5 个示例。我应该预测该用户对测试集中其他喜剧的评分。

这就是测试集的样子，但没有评分：

所以我有几个问题：

1.将笑话标识符分为喜剧演员和位置的最佳方法是什么。例如，Klint De Drunk 是喜剧演员，Enugu 1 是地点

在深度学习方面获得最佳预测精度的最佳方法是什么。

谢谢

     Viewers_ID    Joke_identifier              Response_ID         Rating
       0    A1  Klint De Drunk Enugu 1  A1_Klint De Drunk Enugu 1   0.11
       1    A1  Klint De Drunk Enugu 2  A1_Klint De Drunk Enugu 2   -4.64
       2    A1  Klint De Drunk PH 1     A1_Klint De Drunk PH 1      -3.39
       3    A1  Klint De Drunk PH 2     A1_Klint De Drunk PH 2      0.44
       4    A1  Klint De Drunk Lagos 1  A1_Klint De Drunk Lagos 1   -4.83
       5    A1  Klint De Drunk Lagos 2  A1_Klint De Drunk Lagos 2   -4.52

【问题讨论】：

我建议你对此提出两个单独的问题。 #2。就像现在描述的那样过于宽泛。
问题与tensorflow 无关 - 请不要向标签发送垃圾邮件（已删除）。

标签： pandas machine-learning deep-learning recommendation-engine

【解决方案1】：

第 1 点：

使用：

df['Joke_identifier_new'] = df['Joke_identifier'].str.rsplit(n=2).str[0]
df['location'] = df['Joke_identifier'].str.rsplit(n=2).str[1:].str.join(' ')
print(df)

但是，您应该为拆分创建一个新列，不要将其分配回去，因为第二个代码不会产生所需的结果。然后，您可以根据需要删除原始列。

【讨论】：

非常感谢。这会将笑话标识符作为喜剧演员返回。但我想把笑话标识符分成喜剧演员和地点。
代码的第二行将位置拆分为一个名为 location 的列。它不工作吗？这给了我在Joke_identifier_new 列下的Klint De Drunk 和location 列中的Enugu 1