【发布时间】:2019-11-27 16:15:49
【问题描述】:
我有
pd.DataFrame({'text':['fewfwePDFerglergl','htrZIPg','gemlHTML']})
text
0 wePDFerglergl
1 htrZIPg
2 gemlHTML
10k 行长的列。每列包含 ['PDF','ZIP','HTML'] 之一。文本中每个条目的长度最大为 14 个字符。
我如何获得:
pd.DataFrame({'text':['wePDFerglergl','htrZIPg','gemlHTML'],'file_type':['pdf','zip','html']})
text file_type
0 wePDFerglergl pdf
1 htrZIPg zip
2 gemlHTML html
我尝试df.text[0].find('ZIP') 单个条目,但不知道如何将它们拼接在一起以测试并返回列中每一行的正确值
有什么建议吗?
【问题讨论】:
标签: pandas dataframe substring