【问题标题】:How to remove words from a data frame that are not in list in python如何从数据框中删除不在python列表中的单词
【发布时间】:2020-05-21 11:05:12
【问题描述】:

我是一名从事非英语 NLP 工作的初学者,我想清除数据框中未包含在列表 kata_dasar 中的所有单词:

我的代码是:

df['tweet']= [' '.join(w for w in p.split() if w in kata_dasar) for p in df['tweet']]

但它不起作用,请帮助

【问题讨论】:

  • 您好,欢迎来到 StackOverflow!当你说它不起作用时,你能更具体一点吗?您的代码是给您一个错误还是没有按您的预期运行?
  • 您可以在Python remove stop words from pandas dataframe找到类似的问题。

标签: python nlp


【解决方案1】:

一般来说,如果您发现自己想编写一个 for 循环来遍历数据帧的行,请停下来,并尝试找到一种方法来使用 apply 来编写它:

df['tweet'] = df.tweet.apply(lambda p: ' '.join(w for w in p.split() if w in kata_dasar))

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2018-01-08
    • 1970-01-01
    相关资源
    最近更新 更多