【发布时间】:2016-12-01 16:44:39
【问题描述】:
我有一个数据框,其中的一列包含一个或多个变量的任意组合,用“/”分隔符分隔,例如:
Rd/MLERS
Rd
Rd
Rd/DLEPC/DLERS
SLERS
MLERS
等等,等等。我想提取主分类器,即:紧接在第一个“/”字符之前的唯一或第一个变量。我对 str.extract 和我的努力没有太多经验 -
df["primaryEjecta1"] = df["MORPHOLOGY_EJECTA_1"].str.extract('(.*)/', expand=True)
没有按预期工作 -
Rd
NaN
NaN
Rd/DLEPC
NaN
NaN
具体来说——
- 在只有一个变量的情况下,我无意中将其转换为 NaN;
- 如果有三个(或更多)变量,我将提取前两个(或更多),而不仅仅是第一个。
如果您知道如何解决这个问题,当然可以轻松解决 - 但是我能够在网上找到的大多数示例和教程都假定没有重复的漂亮、整洁的分隔符 - 所以感谢你们提供的任何帮助。
【问题讨论】:
标签: python regex python-3.x pandas