【发布时间】:2020-08-17 18:03:27
【问题描述】:
我完成了一个处理销售数据分析的 pandas 教程 (https://www.youtube.com/watch?v=eMOA1pPVUc4&list=PLFCB5Dp81iNVmuoGIqcT5oF4K-7kTI5vp&index=6)。数据已经是数据框格式,在数据框中有一个名为“购买地址”的列,其中包含街道、城市和州/邮政编码。格式如下:
Purchase Address
917 1st St, Dallas, TX 75001
682 Chestnut St, Boston, MA 02215
...
我的想法是将数据转换为字符串,然后删除不相关的列表值。我使用了命令:
all_data['Splitted Address'] = all_data['Purchase Address'].str.split(',')
这适用于将数据转换为表单的逗号分隔列表
[917 1st St, Dallas, TX 75001]
现在,整个“拆分地址”列看起来像这样,我被困在这一点上。我只是想删除列表索引 0 和 2 并保留 1,即另一列中的城市。
在本教程中,解决方案是使用 .apply() 方法制定的:
all_data['Column'] = all_data['Purchase Address'].apply(lambda x: x.split(',')[1])
到目前为止,这个解决方案肯定看起来比我的更优雅,但我想知道我是否可以通过我的方法以相当的努力找到一个解决方案。
提前致谢。
【问题讨论】:
标签: python pandas list dataframe extract