【发布时间】:2018-08-01 17:23:59
【问题描述】:
我正在使用 Pandas 数据框来读取 excel 文件并对其进行一些操作。我有一个包含多行的标题,现在我想按几个列值分组。但是我无法找到解决方案。
Excel 示例:
name address contact_info
first_name last_name street city mobile email
1 AAA BBB XXX YYY 102020 aaa@xyz.com
2 111 222 333 444 239393 bbb@xyz.com
3 BBB 333 XXX dddd 102020 aaa@xyz.com
我想按街道名称分组并从其他列中查找值 我试过了,但它无法找到街道,因为它是多索引。
df = pd.read_excel("test.xlsx", header=[0, 1], sheet_name="Sheet1")
print df.groupby("street", level=-1)[["first_name", "last_name", "email"]].apply(list)
【问题讨论】:
-
看起来你实际上并不需要第一行——那种重复的信息。如果您在没有第一行 (header=1) 或 (skiprows=1) 的情况下阅读它,您将不必处理多索引...让您的工作更轻松。
标签: python python-2.7 pandas dataframe