【问题标题】:how to remove words from a dictionary in dataframe [duplicate]如何从数据框中的字典中删除单词[重复]
【发布时间】:2020-10-04 20:37:41
【问题描述】:

我正在尝试从数据框列中删除某些单词并且失败得很惨......

我的一些示例数据:

    Stock_Name
Vanguard US Government Bond Index GBP Inc (Hedged)
Vanguard US Government Bond Index GBP Acc (Hedged)
Vanguard US Government Bond Index GBP Inc
Vanguard US Government Bond Index USD Acc

字典:

    replace_values = {
        r'\bAcc\b': "",
        r'\bInc\b': "",
        r'\b(Hedged)\b': "",
        r'\bGBP\b': "",
        r'\bUSD\b': ""
}
df["Stock_Name"] = df["Stock_Name"].replace(replace_values,regex=True)

我得到的输出:

Vanguard US Government Bond Index   ()
Vanguard US Government Bond Index   ()
Vanguard US Government Bond Index  
Vanguard US Government Bond Index  

由于某种原因,括号被省略了。我尝试在我的替换值字典中添加“()”,但它似乎没有做任何事情。

【问题讨论】:

标签: python regex dataframe


【解决方案1】:

你应该转义括号:

r"\(\bHedged\b\)": "",

由于\b 表示单词边界,所以应该将其移到括号内。否则它将与您的文本不匹配。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2016-11-12
    • 1970-01-01
    • 1970-01-01
    • 2022-12-09
    • 2023-01-16
    • 1970-01-01
    • 2013-03-07
    • 2012-03-14
    相关资源
    最近更新 更多