【发布时间】:2017-02-24 05:54:35
【问题描述】:
我有一个列名为公司的数据框 df。公司名称的几个例子是:ABC Inc.、XYZ Gmbh、PQR Ltd、JKL Limited 等。我想要一个所有后缀的列表(Inc.、Gmbh、Ltd.、Limited 等)。请注意,后缀长度总是不同的。可能有些公司没有任何后缀,例如:Apple。我需要所有公司名称中所有后缀的完整列表,列表中只保留唯一的后缀。
我该如何完成这项任务?
【问题讨论】:
-
您对某事物作为后缀的判断标准是什么?即,你怎么知道
JKL Limited中的Limited是后缀,而The CarPhoneHouse中的CarPhoneHouse不是? -
@Anaphory 这是我的挑战。我想从公司名称中删除所有后缀。因此,完整字符串中最后一个空格之后的单词可能是后缀。我只想要唯一的列表。我可以手动取出 CarPhoneHouse 之类的词。如果您有更好的方法,请提出建议。
-
附注:公司全名是“Apple Inc.”。
-
@KlausD。你是对的。但是我的数据有很多错误。我刚才举了一个例子来说明可能有很多公司没有任何后缀。