NLP - 将相同含义的单词组合成一个答案

【问题标题】：NLP - Combining Words of same meaning into OneNLP - 将相同含义的单词组合成一个
【发布时间】：2023-03-08 23:35:01
【问题描述】：

我对 NLP 很陌生。我的问题是我可以使用 NLP 将相同含义的单词组合成一个，例如，考虑以下行；

1. It’s too noisy here
2. Come on people whats up with all the chatter
3. Why are people shouting like crazy
4. Shut up people, why are you making so much noise

大家可以注意到，这里的共同点是人们都在抱怨噪音。

noisy, chatter, shouting, noise -> Noise

是否可以使用 NLP 使用通用实体对单词进行分组。我正在使用 R 来解决这个问题。

我使用了一个示例 twitter 数据集，我的预期输出将是一个包含以下内容的表格；

 Noise
It’s too noisy here
Come on people whats up with all the chatter
Why are people shouting like crazy
Shut up people, why are you making so much noise

在此处发布之前，我确实搜索了网络以供参考。任何建议或有价值的意见都会有很大帮助。

谢谢

【问题讨论】：

数据格式是什么样的？它是一个列表，json....请提供一个例子。
@Andre Elrico，数据为 CSV 格式。
grepl 函数是你的朋友，模式为"noisy|chatter|shouting|noise"
#regularExpressions

标签： r nlp tm

【解决方案1】：

你提到的问题更广为人知的是释义，它并没有完全解决。也许如果你想要一个快速的解决方案，你可以开始替换同义词，wordnet 可以提供帮助。

另一种想法是计算句子相似度（只是得到每个句子的向量表示，并使用余弦距离来衡量彼此的相似度）

我认为this paper 可以很好地介绍您的问题。

【讨论】：