【发布时间】:2020-03-25 05:28:05
【问题描述】:
我是那个领域的新手。最近对推特数据做一个情绪分析。并遇到了两种方法: 1)TextBlob - 用于处理文本数据的 python 库 2) 弓(词袋)
它们之间有什么区别?这两种方法是不同的还是有任何相似之处?
【问题讨论】:
标签: python machine-learning data-science textblob
我是那个领域的新手。最近对推特数据做一个情绪分析。并遇到了两种方法: 1)TextBlob - 用于处理文本数据的 python 库 2) 弓(词袋)
它们之间有什么区别?这两种方法是不同的还是有任何相似之处?
【问题讨论】:
标签: python machine-learning data-science textblob
Bag of words 和 TextBlob 用于 NLP 任务中的文本处理。 Bag of words 是 NLP 中使用的模型/概念,而 TextBlob 是用于处理文本数据的 python 库。
词袋模型(简称 BoW)是一种从文本中提取特征以用于建模的方法,例如机器学习算法。
该方法非常简单灵活,可用于从文档中提取特征的多种方式。
词袋是描述文档中单词出现的文本表示。它涉及两件事:
已知单词的词汇表。 测量已知单词的存在。 它被称为单词“包”,因为有关文档中单词顺序或结构的任何信息都被丢弃了。该模型只关注文档中是否出现已知单词,而不关注文档的位置。 阅读更多:-https://machinelearningmastery.com/gentle-introduction-bag-words-model/
TextBlob 是一个用于处理文本数据的 Python 库。它提供了一个简单的 API,用于深入研究常见的自然语言处理 (NLP) 任务,例如词性标注、名词短语提取、情感分析、分类、翻译等。 阅读更多:-https://textblob.readthedocs.io/en/dev/
教程:- https://stackabuse.com/python-for-nlp-introduction-to-the-textblob-library/
【讨论】: