【发布时间】:2020-06-11 13:04:13
【问题描述】:
我有一个熊猫数据框 sample dataframe
df = a1 a2 a3 a4 a5
0 1 1 1 0 #dict[a3_a4] = 1 ,dict[a2_a4] = 1 ,dict[a2_a3] = 1
1 1 1 0 0 #dict[a1_a2] = 1 , dict[a1_a3] = 1, dict[a2_a3] = 1
我需要函数获取数据框作为输入并返回 2 列一起出现的数量并将其存储在字典中 所以我的输出会像
output dict will look like this : {'a1_a2':1,'a2_a3':2, 'a3_a4':1,'a1_a3':1,'a2_a4':1}
PS:我是堆栈溢出的新手,请原谅我的错误。
【问题讨论】:
-
到目前为止您尝试过什么?请阅读此stackoverflow.com/help/minimal-reproducible-example 和此stackoverflow.com/questions/20109391/… 并相应地编辑您的问题。
-
我的数据是 2000 行和 20k 列并且只有 35% 的单元格包含值 1,所以如何也减少时间
标签: python pandas dataframe dictionary