【发布时间】:2017-01-14 13:42:34
【问题描述】:
我想看看发布一件事的用户是否也会发布另一件事。我在 R studio 中使用了 TwittR 包来下载包含关键字的推文,然后在 python 中下载了这些用户的时间线。我的数据结构如下。
用户名、id、created_at、文本
exampleuser,814495243068313603,2016-12-29 15:36:13, 'MT @nixon1788: 奥巴马和左派是令人作呕的反犹太派! #WithdrawUNFunding'
是否可以使用先验算法生成关联规则?有谁知道如何构造这些数据以便使用它,或者是否可以使用我拥有的数据?
【问题讨论】:
-
您希望在这里确定什么样的关联?主题标签之间的关联。或者奥巴马这个名字和负面推文之间的关联。不管怎样,我认为@ImranAli 的建议会大有帮助。
-
嗨,感谢您的回复,我想使用关键字(所以如果有人使用 obama 这个词发推文,他们也会使用“clinton”这个词发推文)我的问题是我不知道如何将我的数据强制转换为交易数据以用于此包。