【发布时间】:2019-08-18 05:05:23
【问题描述】:
我是 Python 新手,需要帮助!
我想在数据框的一列中搜索列表中的项目,如果找到,则将该项目存储在新列中。我的位置列很乱,如果有的话,我正在尝试提取州缩写。
到目前为止,我已经能够找到找到搜索词的列(我不确定这是否 100% 正确),我将如何获取找到的搜索词并将其存储在新列中?
state_search=('CO', 'CA', 'WI', 'VA', 'NY', 'PA', 'MA', 'TX',)
pattern = '|'.join(state_search)
state_jobs_df=jobs_data_df.loc[jobs_data_df['location'].str.contains(pattern), :]
我想获取找到的状态并将其存储在新的“状态”列中。感谢您的帮助。
print (jobs_data_df)
location
0 Madison, WI 53702
1 Senior Training Leader located in Raynham, MA ...
2 Dixon CA
3 Camphill, PA Weekends and nights
4 Charlottesville, VA Some travel required
5 Houston, TX
6 Denver, CO 80215
7 Respiratory Therapy Primary Location : TX- Som...
【问题讨论】:
-
由于您正在进行正则表达式搜索,我想在州名称周围添加
\b,这样一些SKY Hotel, NH就不会匹配肯塔基州。 -
@9000 - 是的,字边界 - 在我的回答中。
-
如果我的回答对您有帮助,请不要忘记accept 它 - 单击答案旁边的复选标记,将其从灰色切换为已填充。谢谢。
标签: python string pandas list search