【问题标题】:Remove fraction from an address in pandas data frame从熊猫数据框中的地址中删除分数
【发布时间】:2018-11-10 16:00:06
【问题描述】:

我在 pandas 中有一个数据框,我想从带有地址的列中删除分数。我无法找出正确的回归实现来删除它们。

示例地址如下所示:

580 1/4 Broadway Street

85 1/4 Grand Street

两件事,我不知道如何遍历数据框来删除特殊字符。

还有两个什么是正确的正则表达式函数以及如何重新组合标志?

我想出了

"^(.)\d+/\d+\s(.)" 和 "\1\2" 将标志组合在一起

或者有没有更好的方法来做到这一点?

【问题讨论】:

    标签: python regex python-2.7 pandas


    【解决方案1】:

    使用str.replace,你根本不需要匹配组。

    df.address.str.replace(r'\d+\/\d+', '')
    
    0    580  Broadway Street
    1        85  Grand Street
    Name: address, dtype: object
    

    【讨论】:

    • 非常感谢。我正用头撞墙试图弄清楚这一点。完美运行。
    • 其实最后一个问题,replace(r'\d+\/\d+', '') 在# 和街道名称之间留下 2 个空格。如何删除 1 个空格?
    • df.address.str.replace(r'\d+\/\d+\s', ''),尽管使用df.address.str.replace(r'\d+\/\d+\s?', '') 可能更安全
    猜你喜欢
    • 1970-01-01
    • 2020-08-17
    • 1970-01-01
    • 2020-03-23
    • 2016-04-30
    • 2019-06-26
    • 2020-05-28
    • 2018-03-15
    • 2016-08-09
    相关资源
    最近更新 更多