【发布时间】:2015-01-22 22:58:00
【问题描述】:
我需要用 R 语言创建一个函数,它将能够将句子切割成单词,然后这些单词与 pos 和 neg 字典中的单词匹配。这可能导致 Sentiment Score - 句子中的积极词等于 1,句子中的消极词等于 -1。
Product_ID Sentence Attribute SentimentScore
1111111 1 graphics 1
1111111 1 windows 1
1111111 2 loads -1
2222222 1 laptops -1
2222222 2 design 1
产品 1111111 的第一句话可能看起来像:...这个产品...很棒的图形...在我的 windows 上运行良好 >.
例如。带有肯定词的字典(pos.txt)如下所示: 一个+ 盛产 比比皆是 丰富 丰富 可访问 无障碍 欢呼 广受好评 ...等等
和带有否定词的字典(neg.txt)看起来像: 2面 2面 异常 废除 可恶 可恶 鄙弃 厌恶 中止 中止 中止 ...等等
我在gitHub 看到了一个名为 score.sentiment 的函数,但它使用每个句子中的 pos 和 neg 词之间的差异来评估所有句子。我需要一些非常相似的东西,但对于单个单词。
我非常感谢您的任何帮助。非常感谢转发。
【问题讨论】:
-
你能提供句子吗?这似乎是一个标记化和匹配的任务。
-
第一个用户:物有所值的好打印机。无线设置非常简单。
-
第二:非常好的笔记本电脑!也对得起这个价格!令人惊叹且用户友好的第三个:这是一款相当不错的笔记本电脑/平板电脑。图片分辨率惊人!你得到的好价格。与 iPad 一样好,价格更优惠。
标签: r