【发布时间】:2020-10-06 17:17:59
【问题描述】:
我有一个 Pandas 数据框,并且正在使用 Jupyter 笔记本。我想突出显示列对重复的行。这是一个例子:
colA = list(range(1,6))
colB = ['aa', 'bb', 'aa', 'cc', 'aa']
colC = [14,3,14,9,12]
colD = [108, 2001, 152, 696, 696]
df = pd.DataFrame(list(zip(colA, colB, colC, colD)), columns =['colA', 'colB', 'colC', 'colD'])
display(df)
我想突出显示这些行,因为 colB 和 colC 中的值是重复的:
我正在尝试这个 lambda 函数,但它会引发错误(而且它只针对一列):
df.style.applymap(lambda x: 'background-color : yellow' if x[colB].duplicated(keep=False) else '')
TypeError: ("'int' object is not subscriptable", 'occurred at index colA')
感谢您的帮助
【问题讨论】:
标签: python-3.x pandas jupyter-notebook duplicates highlight