【发布时间】:2020-09-02 17:34:23
【问题描述】:
我想制作我的 pyspark 代码,以便它可以从数据框列中删除标点符号。我的代码是这样的:
def split(x):
punc = '!"#$%&\'()*+,-./:;<=>?@[\\]^_`{|}~'
x = x.replace(punc, ' ')
return x
结果:
id |
+--------
|187.080/B1
它应该删除所有标点符号,但我不确定我应该编辑什么才能使其正常工作?
【问题讨论】:
-
输入转换为输出的是什么?
标签: python pyspark punctuation