【发布时间】:2017-09-26 17:27:21
【问题描述】:
我有一列包含许多不同的字符串,我想要做的只是将我指定的所有字符串重命名为一个字符串,以便它们都具有相同的字符串。所以我的数据框看起来像这样:
My_strings
1 I bumped my knee because I fell
2 I fell off my bike but I had a helmet
3 I am alright I just need to be alert
4 If I fall I will get back up
所以在我的列 My_strings 中说,我想查找包含特定单词的句子。
df.loc[df.T_L_DESC.str.contains("fell|fall|fallen", na=False), 'Slippery'] = df.T_L_DESC
我正在寻找的特定词是“fell|fall|fallen”,一旦在我的专栏的句子中找到这些词,它们就会被分成另一个名为“Slip_Fall”的专栏
我只想将所有包含这些单词的字符串重命名为一个特定的字符串。有一点需要注意,当我运行上面的代码时,它会使每一个不包含其中指定单词的句子 NaN 所以我的最终数据框看起来像这样:
My_strings Slippery
1 I bumped my knee because I fell Life_Lessons
2 I fell off my bike but I had a helmet Life_Lessons
3 NaN NaN
4 If I fall I will get back up Life_Lessons
所以我不想明显地将我在数据框中获得的 NaN 值更改为 Life_Lessons 我只想将包含我的关键字的句子更改为 Life_Lessons
提前致谢
【问题讨论】:
标签: python pandas dataframe col