【问题标题】:Spark Physical Plan & Logical PlanSpark 物理计划和逻辑计划
【发布时间】:2018-05-20 07:11:48
【问题描述】:

我有两个问题:

  1. 如果不添加任何额外的代码来打印提交的 spark 作业的逻辑和物理计划,有没有办法查看集群上运行的 spark 作业的物理和逻辑计划。

    李>
  2. 有没有办法为集群上正在运行的 spark 作业动态修改执行计划以获得更好的性能。

请分享你的想法。

提前致谢。

【问题讨论】:

    标签: apache-spark


    【解决方案1】:
    1. 都是物理的

      val df: DataFrame  = ???
      
      df.queryExecution.executedPlan
      

      可以使用queryExecution 属性访问逻辑计划。

      df.queryExecution.logical
      
    2. 是的,您可以实现自己的优化器规则。此功能通常没有正式记录,但有一些可用的外部资源:

    【讨论】:

    • 好的,我想知道在集群上运行作业时,我们如何才能看到完整的逻辑或物理计划。
    • 我想这篇文章可能对dzone.com/articles/…有帮助
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2018-01-21
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2018-05-31
    • 1970-01-01
    相关资源
    最近更新 更多