【发布时间】:2018-12-01 20:15:51
【问题描述】:
首先,我有一个已转换为数据框 (df) 的 excel 文件(或 csv 文件)。
接下来,第一列中有一个字符串主列表,其中包含字母数字字符。
然后,在后续列中有字符串列表,可以是相同长度 (list1)、更短 (list2) 或更长 (list3)。
我想count(或sum)master_list 与其他列表之间完全匹配的数量。
# Assign spreadsheet filename to `file`
file = "list_match.xlsx"
# Load spreadsheet
import pandas as pd
df = pd.read_excel(file)
print (df)
master_list list1 list2 list3
abc abc abc stu
def xxx def zzz
ghi xxx yyy zzz
jkl xxx yyy zzz
mno1 xxx yz1 zzz
pqr xxx zzz
stu xxx zzz
vwx xxx zzz
yz1 xxx zzz
yz2 xx1 zzz
yz3 xx1 zzz
zzz
mno1
zzz
目标是创建这个结果:
List Count
list1 1
list2 3
list3 2
结果说明:
- list1 中有一个匹配项:'abc'
- list2 中有三个匹配项:'abc'、'def'、'yz1'
- list3 中有两个匹配项:'stu'、'mno1'
我的问题类似于this question,除了数据被转置并且有多个列表需要比较,这可能需要循环。
【问题讨论】: