【发布时间】:2018-03-26 14:45:41
【问题描述】:
我正在尝试实现一个等效于 pandas 查询的 SQL 查询:
df.groupby([df.ST_STATE, 'INVOICE'])['VALUE'].sum()
这将返回所有发票及其在状态组中的值,如下所示:
WV 114763 28.00
116443 16.50
116490 24.00
116550 46.00
WY 100099 9.00
100148 9.00
100881 32.00
101119 28.00
我编写了一个 SQL 查询来从 Google Cloud 获取相同类型的结果集:
query = "SELECT State, Invoice, sum(Value) FROM ["+self.table+"] group by Invoice, State"
但它返回一个标准的结果集:
State Invoice f0_
0 NY 100008 86.00
1 None 100335 64.00
2 NY 100685 60.00
我需要如何操作 SQL 查询以获得与我的 DataFrame 示例相同形状的结果?
【问题讨论】:
-
您是指状态值不重复的多索引感觉,而是重复值为空白的数据透视表方式?
-
是的,我想首先制作一个多索引数据框
-
基于您提供的相关示例数据 - 请显示预期结果
标签: sql pandas google-bigquery