【发布时间】:2020-05-10 03:46:27
【问题描述】:
我们可以选择没有分类的特征吗?如果我有文本,我怎么知道要选择哪些特征?我需要关于文本的示例而不是真实的单词对象示例。如果有人可以解释一下吗?
【问题讨论】:
标签: machine-learning text-classification feature-selection
我们可以选择没有分类的特征吗?如果我有文本,我怎么知道要选择哪些特征?我需要关于文本的示例而不是真实的单词对象示例。如果有人可以解释一下吗?
【问题讨论】:
标签: machine-learning text-classification feature-selection
文本分类是根据文本的特征对文本进行分类。例如,您可以将句子分类为具有积极(“我很高兴”)或消极(“我很伤心”)情绪。
文本特征选择有效地决定了您希望如何对文本进行编码,以便您可以通过分类器运行它。有很多方法可以做到这一点。例如,您可以使用一袋词表示,其中每列代表词汇表中的一个词,每个单元格代表该词在文档中出现的次数。
如果你有两个句子,“I am so happy, so very happy”和“I am so sad”,你对句子的编码可能是
|我 ||上午 |所以|快乐 |非常|伤心 |
【讨论】: