【问题标题】:How to split a feature in pandas如何在熊猫中分割特征
【发布时间】:2019-02-16 20:44:55
【问题描述】:

这是我正在处理的训练集的前 5 个示例。我应该预测该用户对测试集中其他喜剧的评分。

这就是测试集的样子,但没有评分:

所以我有几个问题:

1.将笑话标识符分为喜剧演员和位置的最佳方法是什么。例如,Klint De Drunk 是喜剧演员,Enugu 1 是地点

  1. 在深度学习方面获得最佳预测精度的最佳方法是什么。

谢谢

     Viewers_ID    Joke_identifier              Response_ID         Rating
       0    A1  Klint De Drunk Enugu 1  A1_Klint De Drunk Enugu 1   0.11
       1    A1  Klint De Drunk Enugu 2  A1_Klint De Drunk Enugu 2   -4.64
       2    A1  Klint De Drunk PH 1     A1_Klint De Drunk PH 1      -3.39
       3    A1  Klint De Drunk PH 2     A1_Klint De Drunk PH 2      0.44
       4    A1  Klint De Drunk Lagos 1  A1_Klint De Drunk Lagos 1   -4.83
       5    A1  Klint De Drunk Lagos 2  A1_Klint De Drunk Lagos 2   -4.52

【问题讨论】:

  • 我建议你对此提出两个单独的问题。 #2。就像现在描述的那样过于宽泛。
  • 问题与tensorflow 无关 - 请不要向标签发送垃圾邮件(已删除)。

标签: pandas machine-learning deep-learning recommendation-engine


【解决方案1】:

第 1 点:

使用:

df['Joke_identifier_new'] = df['Joke_identifier'].str.rsplit(n=2).str[0]
df['location'] = df['Joke_identifier'].str.rsplit(n=2).str[1:].str.join(' ')
print(df)

但是,您应该为拆分创建一个新列,不要将其分配回去,因为第二个代码不会产生所需的结果。然后,您可以根据需要删除原始列。

【讨论】:

  • 非常感谢。这会将笑话标识符作为喜剧演员返回。但我想把笑话标识符分成喜剧演员和地点。
  • 代码的第二行将位置拆分为一个名为 location 的列。它不工作吗?这给了我在Joke_identifier_new 列下的Klint De Drunklocation 列中的Enugu 1
猜你喜欢
  • 2018-05-01
  • 1970-01-01
  • 2018-09-27
  • 1970-01-01
  • 2020-12-29
  • 1970-01-01
  • 2020-10-02
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多