【发布时间】:2014-04-17 02:03:34
【问题描述】:
使用 str.contains 时是否有等价物?
以下代码因为“Sa”而错误地将“Said Business School”列在类别中。如果我可以创建一个单词边界,它将解决问题。在搞砸之后放一个空格。我正在使用熊猫,它们是 dfs。我知道我可以使用正则表达式,但只是好奇我是否可以使用字符串来使其更快
gprivate_n = ('Co|Inc|Llc|Group|Ltd|Corp|Plc|Sa |Insurance|Ag|As|Media|&|Corporation')
df.loc[df[df.Name.str.contains('{0}'.format(gprivate_n))].index, "Private"] = 1
【问题讨论】:
-
对不起,我用的是熊猫!
-
只要使用正则表达式分词...
-
@poke:需要使用
r'\b...'(原始字符串)。与正则表达式相同的老问题。
标签: python regex string pandas word-boundary