【发布时间】:2017-05-11 06:36:27
【问题描述】:
我有两个列表,其中一个包含另一个列表的子字符串。我想从列表 B 中提取所有在列表 A 中具有匹配子字符串的行。
例如, 列表 A:
Sally Hope
Bob John
Seth Whale
列表 B
[('Sally Hope does not like chocolate', 14)
('Sally Hope is great', 45)
('Seth Whale likes swimming', 43)
('Marley does not like walks', 56)
('John goes on walks', 55)]
输出:
[('Sally Hope does not like chocolate', 14)
('Sally Hope is great', 45)
('Seth Whale likes swimming', 43)]
我已经在 R 中使用 amatch 和 dpylr 过滤器进行了尝试,但没有得到所需的输出,并且 R 在内存上失败了(列表 B 有大约 2m 行)。在 python 中执行此操作的最有效方法是什么?
【问题讨论】: