【发布时间】:2021-08-03 19:40:04
【问题描述】:
我想使用推文从数据框中删除所有标点符号和拉丁字符以进行情绪分析。代码如下。我想从列中删除标点符号,但代码删除了文本,只剩下标点符号!!有什么建议吗?
remove_puncts = lambda x: re.sub("[^A-Za-z0-9\s]+", "", str(x))
df['new'] = df.Tweet.apply(remove_puncts)
【问题讨论】:
-
请再次检查my answer,正则表达式按预期工作。因此,您的问题目前不可重现。请提供更多详细信息,最好是重现您的问题的最小示例。
标签: python pandas sentiment-analysis punctuation