【发布时间】:2018-03-29 10:14:52
【问题描述】:
我有一个这样的数据框: pta corpus
pta_content 的每一行都是优惠贸易协定的内容。我正在尝试计算每一行之间的相似度,并获得一个名为 pta 的相似度矩阵。
我尝试过 stringdist,似乎 stringdist 用于两个数据帧。如何计算数据框中每一行之间的成对相似度?
【问题讨论】:
-
stringdistmatrix会这样做 -
可能只是使用
dist()。此外,分享可重复的示例总是一个好主意。图片在这里并没有真正的帮助。 -
@RanaUsman dist() 只能应用于数值矩阵或数据框。我有字符串行。
标签: r