【发布时间】:2021-08-01 23:47:03
【问题描述】:
我有一个看起来像的熊猫数据框
country region values
A CA [0, 0, 1, .5]
B NE [0, 0, 0, 1]
C CA [1, 1, 1, .5]
D CA [1, 0, 1, .5]
E EE [0, .5, .5, 0]
F NE [0, 1, 1, 1]
G EE [0, 0, 0, 0]
H NE [0, .5, 1, .5]
I EE [nan, 0]
我想知道哪些国家的所有 4 个值 1、.5、0 或 3 个值 1、0、.5 或 2 个值 1、.5 或 0。值 1 等于采用(A ), .5 等于部分采用 (PA),等于未采用 (NA)。例如:
country region values #A_all4 #A_any3 #A_any2 #PA_all4 #PA_any3 #PA_any2
A CA [0, 0, 1, .5] 0 0 0 0 0 0
B NE [0, 0, 0, 1] 0 0 0 0 0 0
C CA [1, 1, 1, .5] 0 1 0 0 0 0
D CA [1, 0, 1, .5] 0 0 1 0 0 0
E EE [0, .5, .5, 0] 0 0 1 0 0 0
F NE [0, 1, 1, 1] 0 1 0 0 0 1
G EE [0, 0, 0, 0] 0 0 0 0 0 0
H NE [0, .5, 1, .5] 0 0 0 0 0 1
I EE [nan, 0] 0 0 0 0 0 0
我想为所有值(已采用、部分采用和未采用)执行此操作,但我没有足够的空间来执行此操作。尝试使用 lambda 进行过滤,但它没有给我需要的结果。任何建议都会很棒!谢谢
【问题讨论】:
-
H 国是否也将 #A_any2 设置为 1,因为这两个 .5?
-
不只是,PA_any2 因为这些值被视为因素,而不是数字
标签: python pandas list lambda filter