【发布时间】:2026-01-18 06:00:02
【问题描述】:
我正在尝试对 twitter 数据集执行情绪分析。为此,我使用了很少的正面和负面字典。我想要的是下面的推文
电影侦探太棒了
正面词典:Good 2 Awesome 5
否定词典:bad -2 insanely -3
所以这条推文的分数应该是 = -3(疯狂)+ 5(真棒)= 2
我已经能够将我的数据集与这些字典进行匹配,以创建一个 posMatch 变量,如下所示:posMatches
posMatches NA NA NA NA 1104 NA NA NA NA NA NA NA NA NA NA NA NA 1836 NA 现在我知道哪个位置包含匹配项。在上面的例子中,我需要帮助来计算位置 1104 和 1836 的权重
【问题讨论】:
标签: r statistics analytics sentiment-analysis