【发布时间】:2020-02-18 14:39:16
【问题描述】:
我正在尝试在数据框 (Python) 中的列之间查找相似性。我可以得到 % 或(介于 0 和 1 之间)的相似度吗?
我能够在 python 中找到 vlookup 替代方法,我知道我可以加入哪一列(参考:vlookup in Pandas using join) 但我不确定第二个数据框的哪一列我会有特定的匹配(我想对第二个 DF 中的每一列进行 vlookup 并希望找到相似性)。
df.merge(df1, on='id', how='left')
例 1:
id name flag
128 shyam T
129 ram F
130 alex F
131 chinming F
132 jose T
133 khader T
例 2:
ex_id hig
129 FULL
130 LOW
133 MID
前 3:
c_id loc
129 hy
132 tx
134 ca
我不确定要与上面列出的两个数据框中的任何一个连接什么,但我想在 Ex 1 的数据框中找到不同列之间的关系或相似性。
【问题讨论】:
-
嘿!请问,你是想根据列的相似性加入两个数据帧,还是想在一个单一的数据帧中找到两列的相似性?
-
嘿!我试图找到跨数据帧的列之间的相似性。在上面提到的示例中,如果我可以根据值的相似性(理想情况下在 0 到 1 范围内)将“id”映射到“ex_id”和“c_id”。 PS:必须进行多对多比较。谢谢
标签: python python-3.x pandas dataframe