【发布时间】:2020-10-12 13:05:21
【问题描述】:
如果当前索引处的术语是以下术语的子字符串,我希望我的 python 脚本删除 DataFrame 中的一行。此外,如果以下术语是当前索引处的术语的子字符串。
在下面的示例中,只有最后一个带有术语“A 600 Strom”的数据集以及“Silent”应保留。
term timestamp
83 A 6 2018-09-27 18:26:46
85 A 60 2018-09-27 18:26:46
86 A 600 2018-09-27 18:26:46
89 A 600 2018-09-27 18:26:47
91 A 600 S 2018-09-27 18:26:47
93 A 600 Str 2018-09-27 18:26:48
95 A 600 Stro 2018-09-27 18:26:49
97 A 600 Str 2018-09-27 18:26:53
98 A 600 Strom 2018-09-27 18:26:5
99 S 2018-09-27 18:26:48
100 Sil 2018-09-27 18:26:49
101 Silen 2018-09-27 18:26:53
102 Silent 2018-09-27 18:26:5
是否有优雅高效的解决方案,还是我必须在循环中处理一系列 if 语句?
【问题讨论】:
-
是始终采用相同格式的术语
A 600 Storm即B 250 Rain和B 2将是它的子集 -
不是。它也可能是“天气”之类的东西,“天气”将是一个子集。为了更好地理解:数据来自收集用户所有搜索查询的应用程序,因此该术语可以是任何格式
-
表中有用户键吗?
-
是的,但不幸的是它不一致,因此不能真正使用
标签: python pandas dataframe substring