【发布时间】:2023-03-06 17:12:02
【问题描述】:
我正在尝试从 Pandas 系列中的每个标量值中删除所有少于 4 个字符的单词。最好的方法是什么?这是我失败的尝试:
df['text'] = df['text'].str.join(word for word in df['text'].str.split() if len(word)>3)
我收到以下错误消息:
AttributeError: 'generator' 对象没有属性 'join'
我在这篇文章中的尝试基于字符串中的相同内容:Remove small words using Python
旁注:如果在删除前用少于 4 个字符标记我的话更好,请告诉我。
编辑:每个标量值都包含句子,所以我想删除值中长度小于 4 的任何单词。
【问题讨论】:
-
我会考虑接受@piRSquared 的解决方案。我觉得这更“恐慌”。不过,进行一些性能比较会很有趣,让最快的获胜!