【问题标题】:Dynamic pivot in databricks/spark SQL?databricks/spark SQL中的动态数据透视?
【发布时间】:2020-02-27 18:55:35
【问题描述】:

在 SQL(databricks/spark SQL)中进行透视时,有没有办法动态设置 for-in 的“in”部分?

例如这段代码:

select *
from (select office, country, revenue from sales)
pivot (
  sum(revenue)
  for country in ('US', 'CA', 'UK') 
) 

...工作正常,但 country 列每个月会有不同的值,所以我不想每次都查看并重新编写代码。我尝试将countryselect distinct country from sales 放在那里,但这些都不起作用。有什么想法吗?

【问题讨论】:

  • 你能添加一些示例数据和预期输出吗?
  • 运气好能找到解决办法吗?我们渴望做类似的事情。
  • @Brendan 道歉,我不记得我是否找到了解决方案。这是我不再从事的工作,所以我也无法查找代码。抱歉,我无法提供更多帮助。
  • @Brendan 运气好能找到解决方案吗?

标签: sql apache-spark-sql pivot databricks


【解决方案1】:

我被简化为使用动态雕刻的 IN() 列表构建查询的字符串。有点让人失望。但这种技术也意味着我可以动态应用合理的旋转别名。 但我不知道这是否在 pyspark -v- Spark SQL 中做得更好

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2017-11-15
    • 2022-01-18
    相关资源
    最近更新 更多