【问题标题】:how to remove all punctuation and other symbols from text document in python?如何从python中的文本文档中删除所有标点符号和其他符号?
【发布时间】:2019-08-04 12:58:12
【问题描述】:

我想清理数据集以进行分类。我想从文本中删除所有无用的符号。

如何删除所有这些无用的符号,以便文本准备好进行标记和拆分?

【问题讨论】:

  • 关于从 python 中的字符串中删除特定符号的 许多 问题可能重复。在提出新问题之前,请花时间搜索您的问题。如果您认为您的问题不是重复的,请说明您的案例有何不同之处,以便现有问题无法解决它:)

标签: python-3.x symbols data-cleaning


【解决方案1】:

使用此代码,您可以从字符串中删除一个字符:

x = "abcdef"
x = x.replace("a", "")
print(x)
#output: "bcdef"

如果你想删除多个字符,你可以多次使用替换功能,或者你可以这样做:

x = "abcdef"
to_remove = "be"
for i in to_remove:
    x = x.replace(i, "")
print(x)
#output: "acdf"

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2013-11-19
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2013-09-05
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多