【发布时间】:2016-10-22 09:10:25
【问题描述】:
从这个问题开始。
Python Pandas: remove entries based on the number of occurrences
data = pandas.DataFrame(
{'pid' : [1,1,1,2,2,3,3,3],
'tag' : [23,45,62,24,45,34,25,62],
})
# pid tag
# 0 1 23
# 1 1 45
# 2 1 62
# 3 2 24
# 4 2 45
# 5 3 34
# 6 3 25
# 7 3 62
g = data.groupby('tag')
g.filter(lambda x: len(x) > 1) # filters out lengths > 1.
# pid tag
# 1 1 45
# 2 1 62
# 4 2 45
# 7 3 62
#This would create a new object g:
g = g.filter(lambda x: len(x) > 1) #where g is now a dataframe.
我想知道有没有办法通过删除来过滤掉“组”
它们来自原始对象g。而且,它会比从过滤后的 groupby 创建一个新的groupby 对象更快吗?
【问题讨论】:
标签: python pandas filter group-by