【发布时间】:2019-05-21 16:46:11
【问题描述】:
如何从一组元组中过滤数据帧,使配对相同?我需要一种更优雅的写作方式。我尽量不使用合并,因为它会降低效率。
所以我有一个名为 tup_list 的元组列表:
[('118', '35'), ('35', '35'), ('118', '202')
假设每个元组中的第一个元素是 A,第二个是 B,我试图根据这个 tup_list 过滤我的数据帧,其中配对需要相同。
原始数据框:
A B
118 35
118 40
35 202
118 1
35 35
根据tup_list过滤后,新的dataframe应该是:
A B
118 35
35 35
只应返回精确的配对。
目前我使用df= df.merge(tup_list, on=['A','B'], how='inner'). But is not very efficient as my actual data is larger.
请提供更有效的写作方式。
【问题讨论】:
-
stackoverflow.com/a/37757496/7053679 看到这个答案并使用
dasklibrary -
大多少?
-
大约 800mb
-
我猜仍然适合 RAM,所以这应该很快
标签: python pandas dataframe filter tuples