【问题标题】:Difference between BOW(Bag Of Words) and TextBlobBOW(Bag Of Words)和TextBlob之间的区别
【发布时间】:2020-03-25 05:28:05
【问题描述】:

我是那个领域的新手。最近对推特数据做一个情绪分析。并遇到了两种方法: 1)TextBlob - 用于处理文本数据的 python 库 2) 弓(词袋)

它们之间有什么区别?这两种方法是不同的还是有任何相似之处?

【问题讨论】:

    标签: python machine-learning data-science textblob


    【解决方案1】:

    Bag of words 和 TextBlob 用于 NLP 任务中的文本处理。 Bag of words 是 NLP 中使用的模型/概念,而 TextBlob 是用于处理文本数据的 python 库。

    词袋模型(简称 BoW)是一种从文本中提取特征以用于建模的方法,例如机器学习算法。

    该方法非常简单灵活,可用于从文档中提取特征的多种方式。

    词袋是描述文档中单词出现的文本表示。它涉及两件事:

    已知单词的词汇表。 测量已知单词的存在。 它被称为单词“包”,因为有关文档中单词顺序或结构的任何信息都被丢弃了。该模型只关注文档中是否出现已知单词,而不关注文档的位置。 阅读更多:-https://machinelearningmastery.com/gentle-introduction-bag-words-model/

    TextBlob 是一个用于处理文本数据的 Python 库。它提供了一个简单的 API,用于深入研究常见的自然语言处理 (NLP) 任务,例如词性标注、名词短语提取、情感分析、分类、翻译等。 阅读更多:-https://textblob.readthedocs.io/en/dev/

    教程:- https://stackabuse.com/python-for-nlp-introduction-to-the-textblob-library/

    【讨论】:

      猜你喜欢
      • 2019-01-08
      • 2013-08-14
      • 1970-01-01
      • 2017-07-03
      • 2013-01-20
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2018-09-25
      相关资源
      最近更新 更多