【问题标题】:Text Cleaning before using TextBlob for Sentiment Analysis使用 TextBlob 进行情感分析之前的文本清理
【发布时间】:2022-06-22 09:12:23
【问题描述】:

您是在使用 TextBlob 之前清理文本(数据)还是先使用 TextBlob 然后清理文本(从标点符号、停用词等)?

【问题讨论】:

  • 请提供足够的代码,以便其他人更好地理解或重现问题。

标签: nlp sentiment-analysis textblob


【解决方案1】:

我都试过了。清洁后我似乎得到了更好的结果,但这是在小样本量上进行的。试试 TextBlob(data) TextBlob(cleaned_data)。它有助于降低一篇关于车祸的文章的分数。如果您非常了解未清理的数据,则可以评估哪个效果更好。 data.lower() 也可能很好。这使它全部小写。如果这对 TextBlob 有帮助,我想知道,但这是我在清理文本时通常会做的事情。

【讨论】:

    猜你喜欢
    • 2018-06-25
    • 1970-01-01
    • 2017-10-07
    • 2020-03-26
    • 1970-01-01
    • 1970-01-01
    • 2020-10-13
    • 1970-01-01
    • 2020-08-14
    相关资源
    最近更新 更多