【发布时间】:2022-06-22 09:12:23
【问题描述】:
您是在使用 TextBlob 之前清理文本(数据)还是先使用 TextBlob 然后清理文本(从标点符号、停用词等)?
【问题讨论】:
-
请提供足够的代码,以便其他人更好地理解或重现问题。
标签: nlp sentiment-analysis textblob
您是在使用 TextBlob 之前清理文本(数据)还是先使用 TextBlob 然后清理文本(从标点符号、停用词等)?
【问题讨论】:
标签: nlp sentiment-analysis textblob
我都试过了。清洁后我似乎得到了更好的结果,但这是在小样本量上进行的。试试 TextBlob(data) 和 TextBlob(cleaned_data)。它有助于降低一篇关于车祸的文章的分数。如果您非常了解未清理的数据,则可以评估哪个效果更好。 data.lower() 也可能很好。这使它全部小写。如果这对 TextBlob 有帮助,我想知道,但这是我在清理文本时通常会做的事情。
【讨论】: